首页> 中文学位 >基于语义簇的中文文本聚类算法研究

【6h】

基于语义簇的中文文本聚类算法研究

代理获取

页面导航

目录
著录项
相似文献
相关主题

目录

声明

致谢

变量注释表

1 绪论

1.1研究背景

1.2国内外研究现状

1.2.1国外研究现状

1.2.2国内研究现状

1.3.1主要研究内容

1.3.2文档组织结构

2 聚类算法相关技术

2.1文本预处理

2.1.1中文分词

2.1.2停用词过滤

2.2文本表示

2.2.1向量空间模型

2.2.2Word2vec模型

2.3文本特征选择方法

2.3.1文档频率特征提取法

2.3.2 信息增益法

2.3.3 2?统计量

2.3.4互信息法

2.4特征权重计算方法

2.5文本相似度计算

2.6文本聚类算法

2.6.1经典K-means算法

2.6.2层次聚类算法

2.7本章小结

3 基于语义簇的中文文本聚类算法

3.1语义簇构建方法

3.1.1特征词语义相似度计算

3.1.2构建语义簇

3.2文本向量的空间变换

3.3 基于语义簇的中文文本聚类

3.4本章小结

4 实验与实验结果分析

4.1实验环境

4.2实验数据

4.3文本聚类评价指标

4.4实验过程和步骤

4.4.1文本的分词、特征词的抽取和量化

4.4.2层次聚类获取语义簇

4.4.3空间变换后进行K-means聚类

4.5实验对比与结果分析

4.6本章小结

5 结论与展望

5.1结论

5.2展望

参考文献

作者简历

学位论文原创性声明

学位论文数据集

展开▼

著录项

作者
孙煦骄;
展开▼
作者单位

辽宁工程技术大学;

展开▼
授予单位辽宁工程技术大学;
学科软件工程
授予学位硕士
导师姓名齐向明;
年度 2019
页码
总页数
原文格式 PDF
正文语种中文
中图分类计算技术、计算机技术;
关键词
语义簇; 中文文本聚类;

相似文献

中文文献
外文文献
专利

1. 基于语义簇的中文文本聚类算法 [J] . 齐向明 ,孙煦骄 . 吉林大学学报（理学版） . 2019,第005期
2. 基于语义的中文文本聚类最佳簇数研究 [J] . 刘金岭 . 计算机工程与设计 . 2010,第009期
3. 基于语境和语义的中文文本聚类算法研究 [J] . 吴勇 ,周军 . 科技信息 . 2010,第035期
4. 基于自适应簇中心选择的文本聚类算法研究 [J] . 翟东海 ,聂洪玉 ,崔静静 . 成都信息工程学院学报 . 2013,第006期
5. 基于语义和图的文本聚类算法研究 [J] . 蒋旦 ,周文乐 ,朱明 . 中文信息学报 . 2016,第005期
6. 基于WEKA的中文文本聚类研究 [C] . 韩普 ,刘艳云 . 2011图书馆信息技术的应用、服务和创新学术研讨会暨第3届数字图书馆与开放源代码软件(DLIBOSS2011)学术研讨会 . 2011
7. 基于语义相似度的中文文本聚类算法研究 [A] . 杨开平 . 2018

代理获取

客服邮箱：kefu@zhangqiaokeyan.com

京公网安备：11010802029741号 ICP备案号：京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有

客服微信
服务号