首页> 中文期刊> 《科技信息》 >一种改进的基于密度和样本数量的K-means算法

一种改进的基于密度和样本数量的K-means算法

         

摘要

对原始K-means算法<行了研究,通过改进,算法能够自动找出合适的k值,并且最大限度的找出孤立点.首先,寻找样本客量的最大可能初始聚类数n.然后做样本圆,将样本圆等分为n份,依据样本点的位置将样本归属到相应的份里,对初始的n个类进行聚类.最后通过应用DBSCAN算法的小类合并策略将需要合并的小类进行了合并.为了测试改进算法的聚类性能,将改进后的算法源码放在新西兰怀卡托大学所开发的开源平台"weka"上,在多个数据集上与原始K-means算法进行了对比实验.验证了改进算法在聚类质量和聚类稳定性上都远优于原始K-means算法.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号