第一个书签之前
Hadoop平台下基于时间与负载均衡的任务调度优化
Hadoop平台下基于时间与负载均衡的任务调度优化
摘要
Abstract
第1章 绪论
1.1课题研究背景及意义
1.2国内外研究现状
1.2.1小作业的研究现状
1.2.2负载均衡的研究现状
1.2.3调度算法的研究现状
1.3 本论文主要研究内容
1.4 论文结构安排
1.5 本章小结
第2章 Hadoop相关技术
2.1 云计算技术
2.1.1云计算概念
2.1.2云计算的分类
2.1.3云计算的主要技术
2.2 Hadoop平台
2.2.1 Hadoop简介
2.2.2 Hadoop的生态系统
2.2.3 分布式文件系统HDFS
2.2.4 MapReduce编程模型
2.3 Hadoop作业调度机制
2.3.1Hadoop作业调度流程
2.3.2Hadoop常见的作业调度算法
2.4本章小结
第3章 基于时间的Reduce任务调度
3.1 MapReduce的执行过程
3.2小作业的Reduce“饥饿”问题
3.3基于时间的Reduce任务调度
3.3.1任务时间评估模型
3.3.2 算法描述
3.4 本章小结
第4章 基于抽样与贪心算法的负载均衡
4.1 MapReduce的数据倾斜问题
4.2抽样估计
4.2.1 抽样类型
4.2.2 抽样分析
4.3基于贪心算法的分区策略
4.3.1分区概述
4.3.2 基于贪心算法的分区策略介绍
4.3.3 基于贪心算法的分区策略算法实现
4.4本章小结
第5章 实验结果与分析
5.1 实验环境的搭建
5.1.1 环境配置
5.1.2 软硬件环境
5.2实验结果分析
5.2.1 小作业的执行效率和资源利用率实验及结果
5.2.2 数据倾斜问题及实验
5.3 本章小结
结 论
致 谢
参考文献
作者简介
攻读硕士期间发表论文和参加科研情况说明
河北工程大学;