首页> 中文学位 >基于语义簇的中文文本聚类算法研究
【6h】

基于语义簇的中文文本聚类算法研究

代理获取

目录

声明

致谢

变量注释表

1 绪论

1.1研究背景

1.2国内外研究现状

1.2.1国外研究现状

1.2.2国内研究现状

1.3.1主要研究内容

1.3.2文档组织结构

2 聚类算法相关技术

2.1文本预处理

2.1.1中文分词

2.1.2停用词过滤

2.2文本表示

2.2.1向量空间模型

2.2.2Word2vec模型

2.3文本特征选择方法

2.3.1文档频率特征提取法

2.3.2 信息增益法

2.3.3 2?统计量

2.3.4互信息法

2.4特征权重计算方法

2.5文本相似度计算

2.6文本聚类算法

2.6.1经典K-means算法

2.6.2层次聚类算法

2.7本章小结

3 基于语义簇的中文文本聚类算法

3.1语义簇构建方法

3.1.1特征词语义相似度计算

3.1.2构建语义簇

3.2文本向量的空间变换

3.3 基于语义簇的中文文本聚类

3.4本章小结

4 实验与实验结果分析

4.1实验环境

4.2实验数据

4.3文本聚类评价指标

4.4实验过程和步骤

4.4.1文本的分词、特征词的抽取和量化

4.4.2层次聚类获取语义簇

4.4.3空间变换后进行K-means聚类

4.5实验对比与结果分析

4.6本章小结

5 结论与展望

5.1结论

5.2展望

参考文献

作者简历

学位论文原创性声明

学位论文数据集

展开▼

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号