文摘
英文文摘
声明
第一章绪论
1.1研究背景与意义
1.2文本聚类的发展和研究现状
1.3论文的主要研究内容
1.4论文结构和安排
第二章中文文本聚类的关键技术
2.1文本聚类
2.1.1文本聚类的形式化描述
2.1.2文本聚类过程
2.1.3文本聚类的应用领域
2.2中文文本聚类的关键技术
2.2.1文本自动分词技术
2.2.2特征选取
2.2.3文本表示
2.2.4文本间的距离和相似度度量
2.2.5聚类算法
2.3语义词典—知网
2.3.1知网基本概念
2.3.2基于知网的词语相似度计算
2.4小结
第三章基于知网语义相似度的文本聚类模型构建
3.1基于词性的文本预处理
3.2构建基于语义特征的文本表示模型
3.2.1文本特征提取
3.2.2建立文本表示模型
3.3文本相似度度量
3.3.1文本与文本之间的相似度度量
3.3.2簇特征提取
3.3.3文本与文本簇之间的相似度度量
3.4基于知网语义相似度的文本聚类算法设计
第四章实验及结果分析
4.1特征降维实验
4.2文本相似度计算实验
4.3文本聚类实验
4.4聚类效果比较
第五章总结和展望
5.1总结
5.2展望
致谢
参考文献
作者在攻读硕士期间的科研成果