云计算下MapReduce编程模型可用性的研究与优化

代理获取

页面导航

目录
摘要
著录项
引文网络
相似文献
相关主题

摘要

云计算的根基是那些隐藏于后台的大规模数据，通常数据的规模可以达到TB甚至PB级别，如何处理如此大量的数据是云计算要面临的主要问题之一。由于数据量非常大，单台机器不可能满足海量数据处理的性能和可靠性等方面的要求。因此如何在分布式数据系统中对大规模数据进行处理，是目前云计算所面临的主要挑战。此前的运算模式已经不能满足云计算环境下的数据处理能力，在此背景下，MapReduce编程模型应运而生。然而 MapReduce编程模型并不完善，多数学者分别针对该模型算法执行效率、内部算法本身、与现有系统集成或者与现有方法论结合等方面做出了相应贡献。而在MapReduce编程模型总体架构上的改进相对来说较少。
　　本文对Google的云平台技术MapReduce和Google File System进行了深入研究，并针对两个技术在Hadoop中的应用（分别对应 MapReduce和Hadoop Distributed File System）进行了深入研究和实践。运用现有框架搭建了一个小型机群，实现了一个用于支持大规模分布式数据处理应用的集群系统，发现了该系统在处理单一节点失效问题上的性能缺陷。提出了使用分层的主从式架构模型以及任务节点元数据备份策略相结合的方式，来解决任务服务器上单一节点失效之后所带来的系统崩溃问题，以此提高了整个系统的可用性同时缓解了任务节点的压力。之后根据本文所做的研究工作，重新搭建了一个改进后的小型应用集群系统，并对改进前与改进后的系统进行了系统的测试和数据收集。通过对数据的汇总、对比及分析，本文得出的结论是，采用本文的架构模型会在系统执行效率方面较传统的主从式架构模型有所下降，但是解决了系统性能瓶颈受限于单一任务服务器的问题，同时大幅提高了系统整体的可用性，因此这种用少量性能换取长时间系统稳定运行的做法是可行的。
　　本文首先对国内外云计算技术研究现状进行了综述，分析了各大公司已有云计算应用的架构与特点；之后，研究与分析了MapReduce编程模型和Google File System等在云计算领域受到广泛关注的技术，并在此基础上进行实验和总结；针对已有应用中出现的单一节点失效问题，提出了使用分层的主从式架构模型与任务节点元数据备份策略相结合的方式对云计算已有架构进行改进，解决了现有系统在任务节点失效之后整体系统瘫痪的问题，同时还降低了任务节点的负荷；最后，对改进前后的集群系统进行了执行效率测试和可用性测试，并对测试数据进行收集、汇总和分析，得出了最终结论。

著录项

作者
周一可;
展开▼
作者单位

上海交通大学;

展开▼
授予单位上海交通大学;
学科软件工程
授予学位硕士
导师姓名王东;
年度 2011
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP393.03;
关键词
云计算; 主从式架构; 可用性; MapReduce编程模型;

相似文献

中文文献
外文文献
专利

1. 基于MapReduce编程模型的节点失效处理与优化 [J] . 黄敬良 . 电脑编程技巧与维护 . 2015,第002期
2. MapReduce编程模型下的上下文离群数据挖掘算法 [J] . 杨海峰 ,于晓龙 ,荀亚玲 . 太原科技大学学报 . 2017,第004期
3. 云计算环境下的资源调度优化模型研究 [J] . 薛玉 . 计算机仿真 . 2013,第005期
4. 基于用户行为特征的云计算资源可用性动态评价模型 [J] . 许普乐 ,王杨 ,黄亚坤 . 计算机科学 . 2016,第0z1期
5. 一种云计算可用性定量计算模型 [J] . 杨志明 ,张嘉慧 . 计算机光盘软件与应用 . 2014,第007期
6. 云计算模式下系统高可用性技术研究 [C] . 崔希宁 . 北京通信学会2011无线及移动通信研讨会 . 2011
7. 云计算中MapReduce高可用性和高效性的优化研究 [A] . 周鸣爱 . 2015

云计算下MapReduce编程模型可用性的研究与优化

目录

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅