基于Spark的分布式大数据并行化聚类方法研究

陶婧

首页> 中文期刊>湖北第二师范学院学报 >基于Spark的分布式大数据并行化聚类方法研究

基于Spark的分布式大数据并行化聚类方法研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

为提高异构复合存储数据库中分布式大数据的检索识别能力,提出一种基于Spark融合聚类的异构复合存储数据库中的分布式大数据并行化聚类方法,构建异构复合存储数据库存储结构模型,提取数据库中的分布式大数据的统计序列特征量,采用相空间结构重组方法进行分布式大数据的信息特征挖掘,在高维相空间中实现分布式大数据关联信息检测和特征挖掘。对提取的特征量采用Spark融合聚类方法实现并行聚类,结合自适应的学习算法实现数据聚类中心的自动搜索,提高聚类的收敛性。仿真结果表明,采用该方法进行异构复合存储数据库中分布式大数据聚类的自适应性能较好,聚类准确度较高,误分率较低,具有很好的数据库检索和特征识别能力。

著录项

来源
《湖北第二师范学院学报》|2019年第8期|49-53|共5页
作者
陶婧;
展开▼
作者单位

芜湖职业技术学院安徽芜湖241000;

展开▼
原文格式 PDF
正文语种 chi
中图分类专用应用软件;
关键词
Spark; 分布式大数据; 并行化聚类; 挖掘;

相似文献

中文文献
外文文献
专利

1. 基于Spark的层次聚类算法的并行化研究 [J] . 余胜辉 ,李玲娟 . 计算机技术与发展 . 2020,第006期
2. 一种基于Spark的图像聚类并行化算法 [J] . 张振 ,冯永亮 ,赵津曼 . 电子制作 . 2019,第003期
3. 基于Spark的密度聚类算法并行化研究 [J] . 朱子龙 ,李玲娟 . 计算机技术与发展 . 2018,第006期
4. Spark并行化改进的SDKB-DBSCAN聚类算法 [J] . 史爱武 ,尹杰 ,范平 . 现代计算机（专业版） . 2021,第014期
5. Spark平台上利用网络加权Voronoi图的分散迭代社区聚类并行化研究 [J] . 颜烨 ,张学文 ,王立婧 . 计算机应用与软件 . 2021,第003期
6. 基于Spark的大数据热图可视化方法研究 [C] . Zhang Fan ,张繁 ,Yuan Zhaokang . 2016中国计算机辅助设计与图形学会大会 . 2016
7. 基于分布式计算的AP聚类并行化方法研究与应用 [A] . 张旭 . 2015

基于Spark的分布式大数据并行化聚类方法研究

摘要

著录项

相似文献

相关主题

期刊订阅