最大距离法选取初始簇中心的K-means文本聚类算法的研究

ZHAI Dong-hai; YU Jiang; GAO Fei; YU Lei; DING Feng

首页> 中文期刊> 《计算机应用研究》 >最大距离法选取初始簇中心的K-means文本聚类算法的研究

最大距离法选取初始簇中心的K-means文本聚类算法的研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Due to the random selection of initial cluster centers， K-means clustering algorithm is prone to local optimal and instability of clustering results， and huge number of iterations. To overcome the above problems， this paper selected the initial cluster ce%由于初始簇中心的随机选择，K-means算法在聚类时容易出现聚类结果局部最优、聚类结果不稳定、总迭代次数较多等问题。为了解决K-means算法所存在的以上问题，提出了最大距离法选取初始簇中心的K-means文本聚类算法。该算法基于这样的事实：距离最远的样本点最不可能分到同一个簇中。为使该算法能应用于文本聚类，构造了一种将文本相似度转换为文本距离的方法，同时也重新构造了迭代中的簇中心计算公式和测度函数。在实例验证中，对分属于五个类别的1 500篇文本组成的文本集进行了文本聚类分析，其结果表明，与原始的K-m

著录项

来源
《计算机应用研究》 |2014年第3期|713-715719|共4页
作者
ZHAI Dong-hai; YU Jiang; GAO Fei; YU Lei; DING Feng;
展开▼
作者单位

School of Information Science & Technology;

Southwest Jiaotong University;

Chengdu 610031;

China;

Engineering School;

Tibet University;

Lhasa 850000;

China;

School of Information Science & Technology;

Southwest Jiaotong University;

Chengdu 610031;

China;

Engineering School;

Tibet University;

Lhasa 850000;

China;

School of Information Science & Technology;

Southwest Jiaotong University;

Chengdu 610031;

China;

Engineering School;

Tibet University;

Lhasa 850000;

China;

展开▼
原文格式 PDF
正文语种 chi
中图分类算法理论;
关键词
K-means聚类算法; 最大距离; 文本聚类; 文本距离; 测度函数; ◢F◣度量值;

相似文献

中文文献
外文文献
专利

1. 基于分治法的初始簇中心选取的K-means聚类算法的研究 [J] . 杜家兴 ,张京京 ,孙剑桥 . 信息系统工程 . 2015,第009期
2. 基于余弦距离选取初始簇中心的文本聚类研究 [J] . 王彬宇 ,刘文芬 ,胡学先 . 计算机工程与应用 . 2018,第010期
3. 优化的初始中心点选取的K-means聚类算法 [J] . 王金金 ,王未央 . 现代计算机（普及版） . 2015,第007期
4. 基于优化初始中心点的K-means文本聚类算法 [J] . 张世博 . 计算机与数字工程 . 2011,第010期
5. 一种优化初始中心点的K-Means文本聚类算法 [J] . 朱颢东 ,钟勇 ,赵向辉 . 郑州大学学报（理学版） . 2009,第002期
6. 基于初始点选取的k-means聚类近似常数算法 [C] . 王守强 ,山东交通学院信息工程系 ,朱大铭 . 第二届中国分类技术及应用学术会议 . 2007
7. 基于最大最小距离法的多中心聚类算法研究 [A] . 周涓 . 2006

最大距离法选取初始簇中心的K-means文本聚类算法的研究

摘要

著录项

相似文献

相关主题

期刊订阅