声明
致谢
变量注释表
1 绪论
1.1研究背景
1.2国内外研究现状
1.2.1国外研究现状
1.2.2国内研究现状
1.3.1主要研究内容
1.3.2文档组织结构
2 聚类算法相关技术
2.1文本预处理
2.1.1中文分词
2.1.2停用词过滤
2.2文本表示
2.2.1向量空间模型
2.2.2Word2vec模型
2.3文本特征选择方法
2.3.1文档频率特征提取法
2.3.2 信息增益法
2.3.3 2?统计量
2.3.4互信息法
2.4特征权重计算方法
2.5文本相似度计算
2.6文本聚类算法
2.6.1经典K-means算法
2.6.2层次聚类算法
2.7本章小结
3 基于语义簇的中文文本聚类算法
3.1语义簇构建方法
3.1.1特征词语义相似度计算
3.1.2构建语义簇
3.2文本向量的空间变换
3.3 基于语义簇的中文文本聚类
3.4本章小结
4 实验与实验结果分析
4.1实验环境
4.2实验数据
4.3文本聚类评价指标
4.4实验过程和步骤
4.4.1文本的分词、特征词的抽取和量化
4.4.2层次聚类获取语义簇
4.4.3空间变换后进行K-means聚类
4.5实验对比与结果分析
4.6本章小结
5 结论与展望
5.1结论
5.2展望
参考文献
作者简历
学位论文原创性声明
学位论文数据集
辽宁工程技术大学;