基于Hadoop的MapReduce计算模型优化与应用研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着互联网的迅速发展，特别是近年来，突飞猛进的移动互联网和电子商务的发展，网络已经进入了互联网+时代。“互联网+”时代具有如下特点：大规模数据集，多终端等。企业建立一套IT系统不仅需要购买硬件等基础设施，还需要专人维护。当企业的规模扩大时还要继续升级各种软硬件设施以满足需要，传统数据处理方法存在数据存储成本过高、数据管理效率低、可靠性较低、并行处理程序编写复杂等不足。尤其是对于中小企业，计算机等硬件和软件本身并非所需，提高计算和存储效率才是其真正的期盼。
　　云计算通过整合服务器集群中的闲散资源，为大数据分布式存储、并行计算等提供了一个有效解决方案。Hadoop以其开源、可伸缩与低成本等优势，已成为一种主流的云计算平台。但是，在某些应用场景，Hadoop也存在一定的缺陷。例如MapReduce的Mapper会产生大量中间结果，而这时的Reducer并没有被调用来合并这些中间结果，增加了网络传输大量中间结果的负担以及造成 Reducer的闲置，总体上降低了MapReduce的效率。
　　本文通过对MapReduce计算模型的工作原理、运行机制和容错机制的研究，提出了一种MapReduce计算模型优化方案。即在Yarn框架中，使用MPI技术实现Reducer与Mapper并行处理中间结果。通过实验可知，本方法提升了MapReduce计算效率，降低了计算与存储的耦合性。另外，通过应用实例——重点污染物排放量测算系统，在不改变该系统的基础上，利用Sqoop数据迁移技术，结合优化后的MapReduce计算模型和存储技术的优点，设计并实现了一种关系型数据库和分布式数据库并存的方案，以期解决关系数据库的存储和访问效率等问题，在实现存储和计算分离的同时降低了中小企业的硬件开支。

著录项

作者
李张永;
展开▼
作者单位

武汉科技大学;

展开▼
授予单位武汉科技大学;
学科软件工程
授予学位硕士
导师姓名陈和平;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类容错技术;
关键词
并行计算; 容错机制; 计算模型; 存储技术; 关系型数据库; 分布式数据库;

相似文献

中文文献
外文文献
专利

1. Hadoop云平台MapReduce模型优化研究 [J] . 张红 ,王晓明 ,曹洁 . 计算机工程与应用 . 2016,第022期
2. 基于Hadoop MapReduce模型的应用研究 [J] . 朱旭光 . 科学中国人 . 2017,第02Z期
3. 基于Hadoop MapReduce模型的应用研究 [J] . 谢桂兰 ,罗省贤 . 微型机与应用 . 2010,第008期
4. 基于hadoop云平台的智能电网MapReduce数据计算技术研究 [J] . 孟祥萍 ,周来 ,王晖 . 电测与仪表 . 2015,第010期
5. 基于Hadoop框架的MapReduce计算模式的优化设计 [J] . 孙彦超 ,王兴芬 . 计算机科学 . 2014,第0z2期
6. 基于Hadoop MapReduce的分布式数据流聚类算法研究 [C] . 蔡斌雷 ,任家东 ,朱世伟 . 第19届全国信息存储技术学术会议 . 2013
7. MapReduce模型在Hadoop实现中计算资源利用率分析和多作业批调度优化 [A] . 于晓龙 . 2016

基于Hadoop的MapReduce计算模型优化与应用研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅