声明
摘要
第1章 绪论
1.1 研究背景及意义
1.2 研究工作
1.3 论文结构安排
第2章 相关理论知识
2.1 Hadoop平台背景
2.1.1 Hadoop的起源及简介
2.1.2 Hadoop的发展及现状
2.2 Hadoop的总体结构与模块简介
2.2.1 Hadoop MapReduce编程模型
2.2.2 Hadoop分布式文件系统HDFS
2.3 Hadoop平台值得研究的主要问题
第3章 Hadoop平台的任务调度算法分析
3.1 任务调度流程
3.1.1 作业的提交
3.1.2 作业的初始化
3.1.3 任务的分配
3.1.4 任务的执行
3.1.5 任务进度和状态的更新
3.1.6 任务的完成
3.1.7 任务的失败
3.2 现有的任务调度算法
3.2.1 FIFO调度算法
3.2.2 公平调度算法(Fair Scheduler)
3.2.3 计算能力调度算法(Capacity Scheduler)
3.2.4 推测式任务调度算法(Speculative Task)
3.3 Hadoop现有的任务调度算法的实验对比
第4章 改进的推测式任务调度算法
4.1 Hadoop调度器的不足
4.1.1 Hadoop原有调度器的缺陷
4.1.2 LATE调度算法的缺陷
4.2 落后任务判定算法的改进
4.2.1 慢任务判定算法的改进
4.2.2 任务的剩余时间估计算法的改进
4.3 慢节点判定算法的改进
4.4 基于数据局部性的任务调度算法
第5章 实验设计及结果分析
5.1 实验环境及实验数据
5.1.1 实验平台的选择及配置
5.1.2 评估方法及实验数据
5.2 LOL调度器的性能评估
5.2.1 系统中存在慢节点
5.2.2 系统中不存在慢节点
5.3 LOL调度器中各参数对性能的影响
5.3.1 SpeculativeCap对LOL调度器的影响
5.3.2 SlowTaskThreshold对LOL调度器的影响
5.3.3 SlowTrackerThreshold对LOL调度器的影响
第6章 结论与展望
6.1 论文总结
6.2 研究展望
参考文献
致谢