声明
摘要
第一章 绪论
1.1 本课题的研究背景和意义
1.2 国内外研究现状
1.2.1 文本相似度计算研究现状
1.2.2 模糊聚类算法研究现状
1.3 本文的主要工作
1.4 论文的组织结构
第二章 相关理论和关键技术
2.1 文档预处理
2.1.1 中文分词
2.1.2 停用词过滤
2.2 文本特征提取
2.2.1 文档频率
2.2.2 互信息
2.2.3 X2统计法
2.2.4 信息增益
2.2.5 期望交叉熵
2.3 文本建模
2.3.1 布尔模型
2.3.2 语言模型
2.3.3 向量空间模型
2.3.4 一元混合模型
2.3.5 隐含语义分析模型
2.3.6 概率潜在语义分析模型
2.4 文本相似度计算
2.4.1 基于语义分析的文本相似度计算
2.4.2 基于统计学的文本相似度计算
2.5 文本聚类算法
2.5.1 基于模型的聚类算法
2.5.2 基于密度的聚类算法
2.5.3 基于网格的聚类算法
2.5.4 基于划分的聚类算法
2.5.5 基于层次的聚类算法
2.5.6 模糊聚类算法
2.5.7 常见聚类算法比较
2.6 本章小结
第三章 基于LDA主题模型和词共现的文本相似度计算
3.1 LDA主题模型
3.1.1 LDA主题模型简介
3.1.2 Gibbs抽样求解
3.2 词共现分析
3.3 基于LDA主题模型和词共现的文本相似度计算
3.4 实验设计与结果分析
3.4.1 评价标准
2.6.1 语料选择
2.6.2 实验步骤及主要参数选取
2.6.3 实验结果分析
3.5 本章小结
第四章 集粒度计算、蚁群算法和模糊思想的聚类算法
4.1 粒度计算
4.1.1 粒度计算简介
4.1.2 粒度计算模型
4.2 蚁群算法
4.2.1 蚁群算法产生背景
4.2.2 蚁群算法的发展
4.2.3 基于蚁群算法的聚类模型
4.3 模糊思想
4.3.1 模糊集合及模糊运算
4.3.2 模糊C均值算法
4.4 集粒度计算、蚁群算法和模糊思想的算法
4.4.1 改进的蚁群聚类算法
4.4.2 改进的FCM聚类算法
4.4.3 实验设计与结果分析
4.5 基于GAFCM算法的文本聚类
4.5.1 文本聚类的实现
4.5.2 实验结果分析
4.6 本章小结
第五章 总结与展望
5.1 总结
5.2 展望
参考文献
致谢
攻读硕士学位期间发表的论文