摘要
第一章 绪论
1.1 课题研究的背景与意义
1.1.1 突发事件新闻文本聚类的来源和背景
1.1.2 文本聚类的主要应用
1.1.3 形式概念分析的研究现状
1.2 本文工作
1.2.1 研究的目标
1.2.2 研究的内容
1.2.3 论文的组织
第二章 形式概念分析用于文本聚类的理论基础
2.1 文本聚类理论
2.2 形式概念分析的相关理论
2.2.1 概念格的构造
2.2.2 概念格的简化
2.2.3 概念格的应用
2.3 本章小结
第三章 突发事件新闻文本分析
3.1 突发事件新闻文本特点及分类
3.2 突发事件新闻文本概念格分析
第四章 突发事件文本概念格的构造
4.1 新闻文本预处理
4.2 突发事件特征词选取
4.3 使用tf-idf方法计算新闻特征项权重
4.4 tf-idf方法的改进
4.5 建立突发事件文本形式背景
4.5.1 多值形式背景的构造
4.5.2 多值形式背景转化为单值形式背景
4.6 概念格构造
4.7 概念格的属性约简
4.8 本章小结
第五章 基于概念格的文本聚类
5.1 概念间的相似度计算
5.2 文本间的相似度计算
5.2.1 时间相似度计算
5.2.2 地点相似度计算
5.2.3 内容相似度计算
5.2.4 文本间的相似度计算
5.3 基于概念格的文本聚类
5.4 基于形式概念分析的突发事件新闻文本聚类流程图
5.5 本章小结
第六章 实验与实验结果分析
6.1 实验语料的准备
6.2 文本聚类处理流程示例
6.3 评测机制
6.4 实验结果及分析
6.5 本章小结
第七章 结论和展望
7.1 本文工作总结
7.2 今后研究工作的方向
参考文献
攻读学位期间取得的研究成果
致谢
个人简况及联系方式
声明