基于密度峰值优化的Canopy-Kmeans并行算法

李琪; 张欣; 张平康; 张航

首页> 中文期刊> 《通信技术》 >基于密度峰值优化的Canopy-Kmeans并行算法

基于密度峰值优化的Canopy-Kmeans并行算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Along with the explosive growth of data scale, how to explore the potential values of big data with clustering algorithm, such as K-means, now becomes a significant research topic. In combination of Canopy with K-means, the selection problem of center points, may be solved, and for the randomness of initial center point selection in canopy-K-means algorithm and the influence of noise on algorithm, a modified M-Canopy-Kmeans algorithm, improved by density peaks, is proposed, and with spark framework, parallel processing of the algorithm is realized. The experiments show that the algorithm exhibits great improvements in accuracy and noise immunity by effectively avoiding the blindness of Cannopy and noise point in samples. In addition, it shows great speed-up ratio and extensibility in Spark parallel framework.%随着数据规模的爆炸式增长,利用K-means等聚类算法挖掘大数据的潜在价值,已成为一个当前较为重要的研究方向.将Canopy算法与K-means算法结合,可解决K个中心点的选取问题.而针对Canopy-Kmeans算法中初始中心点选取随机、算法受噪声点影响等问题,提出了一种利用密度峰值改进的M-Canopy-Kmeans算法,并采用Spark框架实现算法的并行化.实验结果表明,改进后的算法避免了Canopy中心点选取的盲目性,且有效排除了样本中的噪声点,准确性、抗噪性都有明显提高,且在Spark并行框架中具有良好的加速比和扩展性.

著录项

来源
《通信技术》 |2018年第2期|312-317|共6页
作者
李琪; 张欣; 张平康; 张航;
展开▼
作者单位

贵州大学大数据与信息工程学院,贵州贵阳 550025;

贵州大学大数据与信息工程学院,贵州贵阳 550025;

贵州大学大数据与信息工程学院,贵州贵阳 550025;

贵州大学大数据与信息工程学院,贵州贵阳 550025;

展开▼
原文格式 PDF
正文语种 chi
中图分类算法理论;
关键词
密度峰值; Spark; Canopy-Kmeans; 聚类;

相似文献

中文文献
外文文献
专利

1. 基于Hadoop平台Canopy-Kmeans聚类算法优化改进研究 [J] . 周功建 . 安徽广播电视大学学报 . 2018,第004期
2. 基于优化密度峰值聚类算法的城市公共设施热点分布研究 [J] . 康磊 ,刘海砚 ,陈晓慧 . 测绘与空间地理信息 . 2021,第003期
3. 基于密度峰值和近邻优化的聚类算法 [J] . 何云斌 ,董恒 ,万静 . 计算机科学与探索 . 2020,第004期
4. 基于高斯核优化的密度峰值聚类算法 [J] . 王舰 . 电脑知识与技术 . 2020,第028期
5. 基于不相似性度量优化的密度峰值聚类算法 [J] . 丁世飞 ,徐晓 ,王艳茹 . 软件学报 . 2020,第011期
6. 基于Canopy-Kmeans聚类和组合优化的铁矿预配料智能调度方法 [C] . CAO Yue ,曹跃 ,WANG Ya-lin . 2016年第27届中国过程控制会议 . 2016
7. 基于密度峰值的聚类算法优化研究 [A] . 刘振宇 . 2021

基于密度峰值优化的Canopy-Kmeans并行算法

摘要

著录项

相似文献

相关主题

期刊订阅