基于LDA的改进K-means算法在文本聚类中的应用

王春龙; 张敬旭

首页> 中文期刊>计算机应用 >基于LDA的改进K-means算法在文本聚类中的应用

基于LDA的改进K-means算法在文本聚类中的应用

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对传统K-means算法初始聚类中心选择的随机性可能导致迭代次数增加、陷入局部最优和聚类结果不稳定现象的缺陷,提出一种基于隐含狄利克雷分布(LDA)主题概率模型的初始聚类中心选择算法.该算法选择蕴舍在文本集中影响程度最大的前m个主题,并在这m个主题所在的维度上对文本集进行初步聚类,从而找到聚类中心,然后以这些聚类中心为初始聚类中心对文本集进行所有维度上的聚类,理论上保证了选择的初始聚类中心是基于概率可确定的.实验结果表明改进后算法聚类迭代次数明显减少,聚类结果更准确.

著录项

来源
《计算机应用》|2014年第1期|249-254|共6页
作者
王春龙; 张敬旭;
展开▼
作者单位

华北电力大学控制与计算机工程学院,北京 102206;

甘肃省电力公司,兰州 730030;

展开▼
原文格式 PDF
正文语种 chi
中图分类算法理论;
关键词
主题模型; K-means; 聚类中心; 文本聚类; 隐含狄利克雷分布;
入库时间 2022-08-18 04:50:00

相似文献

中文文献
外文文献
专利

1. 基于LDA改进的K-means算法在短文本聚类中的研究 [J] . 冯靖 ,莫秀良 ,王春东 . 天津理工大学学报 . 2018,第003期
2. 基于K-Means改进的算法在客户聚类中的应用 [J] . 陈新华 . 信息通信 . 2020,第009期
3. 基于改进的K-Means算法在SNP选择中的应用 [J] . 陆信蓓 ,周从华 ,张付全 . 计算机与数字工程 . 2020,第008期
4. 基于改进K-means的K近邻算法在电影推荐系统中的应用 [J] . 蔡畅 . 电子技术与软件工程 . 2020,第018期
5. 基于改进的K-means算法在文本挖掘中的应用 [J] . 杨丹 ,朱世玲 ,卞正宇 . 计算机技术与发展 . 2019,第004期
6. 改进蚁群算法在文本聚类中的应用研究 [C] . 吕岩 . 2011年江苏省人工智能学术会议 . 2011
7. 基于改进k-means算法的专利文本聚类研究 [A] . 李铁飞 . 2020

基于LDA的改进K-means算法在文本聚类中的应用

摘要

著录项

相似文献

相关主题

期刊订阅