基于Spark框架的改进并行K-means算法研究

邓青; 杨宁

首页> 中文期刊> 《智能计算机与应用》 >基于Spark框架的改进并行K-means算法研究

基于Spark框架的改进并行K-means算法研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

文献数据库（团队版） >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

传统的K-means算法由于随机选择初始聚类中心,使得聚类结果不精确.随着网络数据量的激增,传统的串行算法运算时间明显太长,有研究者利用Hadoop并行框架进行K-means并行化研究,虽然提高了算法的运行时间,但K-means算法在聚类判定时需要反复迭代,反复进行磁盘的读写操作,很大一部分时间花费在磁盘操作上,并行算法的效率大打折扣.为此,本文提出基于Spark框架的改进并行K-means算法,通过对RDD的操作有效解决了频繁的磁盘读写.在标准数据集下,进行对比实验,通过聚类效果和算法并行的加速比,验证了改进算法的有效性.

著录项

来源
《智能计算机与应用》 |2018年第1期|76-78|共3页
作者
邓青; 杨宁;
展开▼
作者单位

山西轻工职业技术学院,太原030006;

山西云时代技术有限公司,太原030003;

展开▼
原文格式 PDF
正文语种 chi
中图分类 TP311.13;
关键词
Spark; K-means; Map; Reduce; Hadoop; 加速比;

相似文献

中文文献
外文文献
专利

1. 基于Spark框架的改进并行K-means算法研究 [J] . 邓青1 ,杨宁2 . 智能计算机与应用 . 2018,第001期
2. 基于Spark Streaming的并行K-means改进算法研究 [J] . 宋国兴 ,张清伟 ,郑明钊 . 现代计算机（专业版） . 2021,第018期
3. 基于Spark的并行K-means算法研究 [J] . 许明杰 ,蔚承建 ,沈航 . 微电子学与计算机 . 2018,第5期
4. 基于Spark的改进K-means算法的并行实现 [J] . 杜佳颖 ,段隆振 ,段文影 . 计算机应用研究 . 2020,第002期
5. 基于Spark的K-means改进算法的并行化实现 [J] . 宋董飞 ,徐华 . 计算机系统应用 . 2018,第004期
6. 基于Spark的大规模并行协同过滤算法研究 [C] . 佟强 ,张煦渤 ,张蓓赟 . 2017“互联网+、大数据与商业创新国际会议” . 2017
7. 基于Spark的大数据并行聚类算法研究与改进 [A] . 李琪 . 2018

基于Spark框架的改进并行K-means算法研究

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅