基于YARN框架下并行化计算的研究

代理获取

页面导航

目录
摘要
著录项
引文网络
相似文献
相关主题

摘要

Apache开源组织开发的Hadoop框架中最核心的设计就是MapReduce编程模型和HDFS分布式文件系统。MapReduce为海量的数据提供了并行化计算，而HDFS为海量的数据提供了存储。
　　MapReduce是一种并行编程模型，它主要用于海量数据集的并行运算。在最初推出的几年里，这种并行编程模型取得了众多的成功案例，在业界也得到了广泛的支持和肯定，但是随着分布式系统集群的规模不断增长和其他工作负荷的剧增，原框架的问题也就渐渐浮出水面。MapReduce编程模型在现有的机制下需要对它做出大规模的调整来修复其在内存消耗，扩展性，线程模型，可靠性和性能上的缺陷。在过去的几年中，Hadoop团队做了一些bug的修复，但是随着修复的成本越来越高，这表明对原框架作出改变的难度越来越大。所以Apache开源组织为了促进Hadoop框架走的更远，在根本上解决影响MapReduce性能的关键性问题，从0.23.0版本开始，对旧的MapReduce框架进行完全重构，在结构上发生了根本性的变化。Apache开源组织将重构后的MapReduce框架命名为Hadoop2.0或者叫YARN。
　　本文通过详细的阐述了MapReduce的编程思想，工作原理，具体步骤和方法。接着又详细的阐述了YARN编程模式，以及 YARN框架机构，工作原理，具体步骤和方法。并将YARN与MapReduce进行了比较，研究了MapReduce的不足和缺点，并概括了YRAN与MapReduce的不同之处。最后，通过搭建Hadoop集群环境，再基于YARN框架进行了MapReduce并行计算的实验，通过实验证明了，基于 YARN框架下并行计算的高效性，可靠性。

著录项

作者
朱敏明;
展开▼
作者单位

西北师范大学;

展开▼
授予单位西北师范大学;
学科计算机技术
授予学位硕士
导师姓名李忠;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类并行计算机;
关键词
并行化计算; 编程模型; 分布式文件系统; 集群环境;

相似文献

中文文献
外文文献
专利

1. 云框架下的文本挖掘算法并行化研究 [J] . 邢翀 . 设备管理与维修 . 2017,第019期
2. MapReduce 框架下的朴素贝叶斯算法并行化研究 [J] . 幸莉仙 ,黄慧连 . 计算机系统应用 . 2013,第002期
3. 基于CUDA的图像去雾算法并行化计算的研究和设计 [J] . 侯天峰 ,曾舒婷 . 微型电脑应用 . 2019,第012期
4. 基于MapReduce网页文本并行化计算的研究 [J] . 尹铁源 ,张瑞琴 . 信息通信 . 2018,第004期
5. 基于 CPU-GPU 混合计算平台的 RNA 二级结构预测算法并行化研究 [J] . 夏飞 ,朱强华 ,金国庆 . 国防科技大学学报 . 2013,第006期
6. 基于YARN集群的计算加速部件扩展支持 [C] . LI Qin ,李钦 ,ZHU Yanchao . 2014全国高性能计算学术年会 . 2014
7. 基于YARN框架下决策树算法的并行化研究 [A] . 姜如霞 . 2018

基于YARN框架下并行化计算的研究

目录

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅