基于词向量和多特征语义距离的文本聚类算法

张弛; 张贯虹

首页> 中文期刊>重庆科技学院学报（自然科学版） >基于词向量和多特征语义距离的文本聚类算法

基于词向量和多特征语义距离的文本聚类算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对传统文本聚类算法中存在语义相似度计算向量维度高、忽视特征词词频、位置、词距和语义缺失等问题,提出了一种基于词向量和多特征语义距离的文本聚类算法(M-W2-KS).首先使用Word2Vec训练语料库中的所有特征词,以向量形式进行表征;然后综合考虑特征词的词频、位置、词距信息以及特征词间的欧式距离,计算文本间的语义相似度,并将其应用到K-means算法中,实现文本的聚类.实验结果表明,运用M-W2-KS算法,可以有效提升聚类效果,使聚类结果更加准确.

著录项

来源
《重庆科技学院学报（自然科学版）》|2019年第3期|69-7277|共5页
作者
张弛; 张贯虹;
展开▼
作者单位

合肥学院计算机科学与技术系,合肥 230601;

合肥学院计算机科学与技术系,合肥 230601;

展开▼
原文格式 PDF
正文语种 chi
中图分类文字信息处理;
关键词
文本聚类; 词向量; 特征向量; Word2Vec; K-means;

相似文献

中文文献
外文文献
专利

1. 基于关键词语义距离的装备故障文本聚类算法 [J] . 贺伟雄 ,严骏 ,缪德志 . 信息工程大学学报 . 2017,第003期
2. 基于语义距离的高效文本聚类算法 [J] . 冯少荣 ,肖文俊 . 华南理工大学学报（自然科学版） . 2008,第005期
3. 基于词向量和增量聚类的短文本聚类算法 [J] . 杨波 ,杨文忠 ,殷亚博 . 计算机工程与设计 . 2019,第010期
4. 基于特征词向量的短文本聚类算法 [J] . 刘欣 ,佘贤栋 ,唐永旺 . 数据采集与处理 . 2017,第005期
5. 一种结合TF-IDF方法和词向量的短文本聚类算法 [J] . 赵晓平 ,黄祖源 ,黄世锋 . 电子设计工程 . 2020,第021期
6. TFC-Reducing:一种基于属性语义距离和规则的文本型形式背景约简方法 [C] . YANG Xiao-ping ,杨小平 ,HE Wei . 2012中国计算机大会 . 2012
7. 基于语义距离的文本聚类算法研究 [A] . 林丽 . 2007

基于词向量和多特征语义距离的文本聚类算法

摘要

著录项

相似文献

相关主题

期刊订阅