Hadoop迭代优化技术的研究

王晓军; 邹亮亮

首页> 中文期刊>计算机技术与发展 >Hadoop迭代优化技术的研究

Hadoop迭代优化技术的研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Hadoop is a distributed computing framework which has been widely used for dealing with huge data. But Hadoop has some disadvantages to process graph data. Because of strong coupling,graph structure data need multiple iterations which may contains several MapReduce computations instead of one MapReduce computation. It costs too much to restart MapReduce job and exists unnecessary transmission for static data in iteration. Propose map side storage strategy based on Hadoop,the static data is stored in map side and finish some related computations with state data. This strategy could reduce whole running time. Experimental results have shown that map side storage strategy spends less time compared with previous strategy through Hadoop platform.%Hadoop是处理海量数据的分布式计算框架，已经得到了广泛的应用。但是Hadoop处理图结构数据存在一些不足。图结构数据的强耦合特性，无法通过一次MapReduce计算得出结果，而是需要迭代计算，甚至一次迭代需要多次Ma-pReduce完成。而重新启动MapReduce作业，开销较大，以及迭代过程中可能存在静态数据的不必要传输。文中在Hadoop的基础之上，提出map端存储的策略，即将静态数据存储在map端，在map端完成静态与动态数据相关的计算，减少了整个迭代计算的总运行时间。通过搭建修改过的Hadoop平台，与改进前迭代方案进行比较，实验结果表明map端存储策略运行时间得到了一定程度的减少。

著录项

来源
《计算机技术与发展》|2014年第9期|98-102|共5页
作者
王晓军; 邹亮亮;
展开▼
作者单位

南京邮电大学信息网络技术研究所;

江苏南京 210003;

南京邮电大学信息网络技术研究所;

江苏南京 210003;

展开▼
原文格式 PDF
正文语种 chi
中图分类计算机软件;
关键词
Hadoop; 迭代; map端存储;
入库时间 2022-08-18 05:36:35

相似文献

中文文献
外文文献
专利

1. 迭代优化 SVM 网络流量分类技术研究 [J] . 林海涛 ,陈源 . 海军工程大学学报 . 2016,第005期
2. 基于Hadoop的气象数据分布式存储技术研究 [J] . 周笑天 ,冯勇 ,陈益玲 . 信息技术 . 2022,第1期
3. 基于Hadoop电商大数据的挖掘与分析技术研究 [J] . 陈娥祥 . 科技经济市场 . 2021,第001期
4. 基于Hadoop技术的物联网资产管理系统性能研究 [J] . 周少珂 ,张振平 ,邵华 . 河南科技 . 2021,第012期
5. 课程思政融入《Hadoop开发技术》课程教学研究 [J] . 罗利 . 电脑知识与技术 . 2021,第024期
6. 基于迭代优化的平面模板定标技术 [C] . 李占利 ,刘玉龙 . 第二届中华文化遗产数字化及保护研讨会 . 2004
7. 基于迭代优化波前整形实现快速高质量散射成像的研究 [A] . 王颖 . 2020

Hadoop迭代优化技术的研究

摘要

著录项

相似文献

相关主题

期刊订阅