首页> 中文学位 >基于能量感知的Hadoop平台调度器研究
【6h】

基于能量感知的Hadoop平台调度器研究

代理获取

目录

封面

中文摘要

英文摘要

目录

第1章 绪论

1.1课题背景

1.2国内外研究现状

1.3课题的主要工作

1.4论文的内容安排

第2章 Hadoop与Mapreduce深度剖析

2.1 Hadoop平台架构及原理

2.2 Mapreduce运行时环境架构

2.3本章小结

第3章 Hadoop平台的作业调度器研究

3.1作业调度原理

3.2先进先出调度算法

3.3计算能力调度算法

3.4本章小结

第4章 基于能量感知的Hadoop平台调度器设计与实现

4.1调度器设计需求

4.2节能调度器框架概述

4.3信息监测模块及能量度量模型

4.4第一层调度策略及实现

4.5第二层调度策略及实现

4.6本章小结

第5章 实验及结果分析

5.1基于云环境的Hadoop集群搭建

5.2实验验证

5.3本章小结

结论

参考文献

攻读学位期间发表的学术论文

声明

致谢

展开▼

摘要

现如今各行各业的数据每天都在快速增加,学术界和企业发现这些数据中隐藏着巨大的价值。在这种需求下各种数据分析框架和平台发展起来,其中Hadoop是目前最流行的开源平台,该平台实现了Google提出的MAPREDUCE计算模型和GFS存储模型。近年来不断积累的温室气体正在改变全球气候,数据中心的建设也应该把低碳减排放在重要的位置;同时企业在数据中心电能方面的投入也越来越多。目前 Hadoop集群中的主机数目正在不断的增加,数据中心能耗控制问题也越来越突出。因此从Hadoop平台方面研究如何减少Hadoop集群的能量消耗对于环境保护和减少企业成本具有重要的意义。
  结合Hadoop平台的工作原理以及MapReduce计算框架运行时环境的架构,本文确定了从资源与任务调度的角度在Hadoop平台中构建一套能量消耗控制的体系结构。使用先进先出算法的单队列调度器(FIFO Scheduler)和基于计算能力算法的调度器(Capacity Scheduler)是平台自带的两种常用调度器,通过对它们的测试和分析,总结出了这两种调度器对于构建Hadoop平台能量控制框架的缺陷和不足。基于原有调度器的不足本文设计并实现了基于能量感知的Hadoop平台调度器,该调度器中构建了一套能量控制的框架,并设计了两层调度策略来进行作业到资源的节能调度。
  本文设计的基于能量感知的Hadoop平台调度器具有以下两个特点:1)调度器可以调节和平衡Hadoop集群作业运行过程中的Qos和总能耗;2)调度器本身具有高效的调度策略。调度器的整体框架是基于多队列设计的,设计了两层调度策略来完成作业的任务到计算资源之间的动态节能匹配,两层调度策略具有高效性,并且时间复杂度是线性的;多队列中作业的分配使用了类似一致性 hash的方法,保证了作业到队列的高效动态分配以及系统的高并发性。
  本文最后使用XCP(xen cloud platform)云平台构建了具有32台虚拟机的Hadoop集群环境。并在该集群环境中将本文设计的节能调度器与Hadoop平台自带的先进先出调度器和计算能力调度器进行了对比实验,实验对比的目标是在不同的作业输入情况下 Hadoop集群使用不同的调度器时,作业运行总能量消耗和时间消耗两方面的性能;另一方面是对比本文设计的节能调度器自身在控制作业运行能耗和时间消耗的能力。实验结果表明本文设计的节能调度器具有较好的能量控制能力,同时不增加集群作业运行的时间消耗;本文设计的节能调度器在作业运行时间和能耗两方面也具有较好的调节能力。

著录项

  • 作者

    李伟;

  • 作者单位

    哈尔滨工业大学;

  • 授予单位 哈尔滨工业大学;
  • 学科 计算机科学与技术
  • 授予学位 硕士
  • 导师姓名 翟健宏;
  • 年度 2014
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP393.03;
  • 关键词

    能量感知; 云平台; 调度器; Hadoop集群环境;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号