声明
第1章 绪论
1.1研究背景和意义
1.1.1大数据处理技术发展背景
1.1.2 Spark大数据处理平台
1.1.3 Spark任务调度现状及不足
1.2 国内外研究现状
1.2.1分布式任务调度研究现状
1.2.2 MapReduce平台任务调度研究现状
1.2.3 Spark平台任务调度研究现状
1.3本文主要工作
1.4本文组织结构
1.5本章小结
第2章 相关理论与技术基础
2.1大数据处理平台
2.1.1 大数据应用的新特征
2.1.2大数据处理平台的发展过程
2.2 Spark平台
2.2.1 Spark平台概述
2.2.2 Spark运行基本运行流程
2.2.3 Spark平台任务调度
2.3 Spark相关任务调度优化介绍
2.4 本章小结
第3章 Spark任务数据评估方法
3.1 RDD的基本设计原理
3.1.1 RDD概述
3.1.1 RDD之间的依赖关系
3.2 Spark任务执行引擎
3.2.1 Stage的划分与执行
3.2.2 任务的生成与执行
3.3 任务数据评估
3.3.1 任务数据评估方法
3.3.2 任务数据评估方法的有效性
3.4 本章小结
第4章 动态内存感知的Spark任务调度策略
4.1Spark中任务线程并发数的限制
4.2自适应内存资源的动态任务调度策略
4.2.1 初始任务并发数
4.2.2 任务调度并发度的动态调整
4.3算法设计与描述
4.3.1初始任务调度并发算法描述
4.3.2任务调度并发动态调整算法
4.4本章小结
第5章 系统实现与性能分析
5.1系统实现
5.1.1 系统架构
5.1.2 模块功能介绍
5.2性能测试及分析
5.2.1测试环境及实验设置
5.2.2直接性能提升效果对比
5.2.2间接性能比较分析
5.2.3资源利用率的影响
5.3本章小结
总结与展望
参考文献
致谢
附录A 攻读学位期间所发表的学术论文目录
湖南大学;