首页> 中文会议>信息系统协会中国分会第六届学术年会 >基于主题模型的K-means初始聚类中心优化方法

基于主题模型的K-means初始聚类中心优化方法

页面导航

摘要
著录项
相似文献
相关主题

摘要

K-means聚类算法简单高效,适合处理大规模数据,在文本挖掘领域应用广泛,但算法对初始聚类中心的选择非常敏感.本文基于LDA主题模型提出一种优化K-means初始聚类中心的算法.首先通过LDA主题抽取降低文档特征向量维度,将文档映射到主题空间,通过文档的主题特征确定初始聚类中心的选择;然后,利用平均准确率、F-Score和熵作为文本聚类效果评价指标,对选取的初始聚类中心的聚类结果进行评价.选取标准的机器学习语料库20newsgroup中的数据集作为试验数据,实验结果表明该方法可以根据文本语义信息优化Kmeans初始聚类中心的选择,提高K-means文本聚类效果.

著录项

来源
《信息系统协会中国分会第六届学术年会》|2015年|561-568|共8页
会议地点济南
作者
关鹏; 王日芬; 张海永;
展开▼
作者单位

国际信息系统协会中国分会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类 TP311.131;
关键词
数据挖掘; K-means聚类算法; 初始聚类中心; 优化方法; 主题模型;

相似文献

中文文献
外文文献
专利

1. 最小化误差平方和k-means初始聚类中心优化方法 [J] . 周本金 ,陶以政 ,纪斌 . 计算机工程与应用 . 2018,第015期
2. 基于优化初始聚类中心的K-means聚类算法 [J] . 郭文娟 . 科技风 . 2022,第4期
3. 基于相异度与邻域的K-means初始聚类中心选择算法 [J] . 张嘉龙 . 计算机时代 . 2021,第008期
4. 基于邻域密度的K-means初始聚类中心优选方法 [J] . 雒明雪 ,苑迎春 ,陈江薇 . 重庆理工大学学报 . 2021,第010期
5. 基于邻域密度的K-means初始聚类中心优选方法 [J] . 雒明雪 ,苑迎春 ,陈江薇 . 重庆理工大学学报（自然科学版） . 2021,第010期
6. 基于主题模型的不稳定型心绞痛不同兼症及合并病的中医治疗方案优化方法研究 [C] . 冯妍 ,徐浩 ,王以新 . 第四届海峡两岸全科医学大会暨海医会全科医学专业委员会第四届学术年会 . 2017
7. K-means算法参数优化方法研究 [A] . 李璇 . 2017

基于主题模型的K-means初始聚类中心优化方法

摘要

著录项

相似文献

相关主题

期刊订阅