首页> 中文期刊> 《计算机仿真》 >多源信息数据的并行优化抽样聚类K-means算法

多源信息数据的并行优化抽样聚类K-means算法

     

摘要

为了解决K-means算法在面对多源信息数据时,无法对数据集合准确聚类,且处理效率较低等问题,以多源信息数据的特点和传统算法为依据,研究得到一种多源信息数据的并行优化抽样聚类K-means算法.算法利用特征函数和模糊分类中理想的划分函数,对多源信息数据合理化预处理,同时基于Map Reduce模型和Canopy算法定义,获得相同数据并分类到相同子集内,然后采用BK-means算法对Canopy子集达成聚类分析,通过抽样策略令数据空间形成同宽的窗格,根据其范围内点数与最小点数的比较及间距值的确定,对数据点实施去除,通过最大最小距离方法对新的聚类中心和模式进行选择,最后令并行优化抽样聚类K-means算法得到有效的实现.经过仿真,上述算法不仅并行性较好,聚类精准度较高,并且具备极佳的鲁棒性和收敛性,处理时长有明显的缩短.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号