基于均值密度中心估计的k-means聚类文本挖掘方法

符保龙; 张爱科

首页> 中文期刊> 《重庆邮电大学学报：自然科学版》 >基于均值密度中心估计的k-means聚类文本挖掘方法

基于均值密度中心估计的k-means聚类文本挖掘方法

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

文本挖掘作为数据挖掘的重要研究领域,是检索有用文本信息的重要手段。通过对K-means聚类挖掘方法的基本原理和实现步骤的分析,发现随机选择聚类中心迭代初值、奇异点问题是制约其发展的技术瓶颈,针对该方法的不足,提出了一种基于均值密度中心估计的K-means聚类文本挖掘方法,采用基于均值密度的聚类中心初值估算取代原有方法的随机选取模式,设计自适应的邻域形状选择机制,用均值密度配合阈值消除奇异点。实验结果表明,提出的方法提高了K-means聚类方法的文本挖掘性能,使得文本挖掘查准率得到很大的提高,不仅强于一般K-means均值聚类方法,且和新近流行的自组织神经网络聚类方法相比也具有一定的优势。

著录项

来源
《重庆邮电大学学报：自然科学版》 |2014年第1期|111-116|共6页
作者
符保龙; 张爱科;
展开▼
作者单位

柳州职业技术学院;

广西柳州545006;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
数据挖掘; 文本挖掘; 均值密度; 聚类中心; 奇异点;

相似文献

中文文献
外文文献
专利

1. 基于均值与最大距离乘积的初始聚类中心优化 K-means 算法* [J] . 段桂芹 . 计算机与数字工程 . 2015,第003期
2. 基于密度峰值优化的K-means文本聚类算法 [J] . 田诗宵 ,丁立新 ,郑金秋 . 计算机工程与设计 . 2017,第004期
3. 基于密度和最近邻的K-means文本聚类算法 [J] . 张文明 ,吴江 ,袁小蛟 . 计算机应用 . 2010,第007期
4. 面向路线图编制的模糊均值文本聚类挖掘方法研究 [J] . 李向东 ,刘晓斌 ,武利平 . 河北工业大学学报 . 2011,第003期
5. 基于优化初始中心点的K-means文本聚类算法 [J] . 张世博 . 计算机与数字工程 . 2011,第010期
6. 基于K-Means特征加权算法的大规模文本数据子空间聚类 [C] . 景丽萍 ,香港大学数学系 ,高阳 . 2005第一届中国分类技术与应用研讨会（CSCA） . 2005
7. 基于密度峰值优化的K-means文本聚类算法研究 [A] . 齐先婷 . 2018

基于均值密度中心估计的k-means聚类文本挖掘方法

摘要

著录项

相似文献

相关主题

期刊订阅