声明
摘要
插图索引
附表索引
第1章 绪论
1.1 研究背景
1.2 研究现状
1.2.1 抽样研究现状
1.2.2 负载均衡研究现状
1.3 研究内容与主要工作
1.4 论文的组织结构
第2章 相关技术介绍
2.1 Spark平台概述
2.1.1 Spark产生背景
2.1.2 Spark生态系统
2.2 Spark系统架构
2.2.1 Spark架构
2.2.2 Spark计算流程
2.2.3 RDD
2.3 MapReduce编程模型介绍
2.3.1 MapReduce架构
2.3.2 Spark—MapReduce
2.4 本章小结
第3章 基于Spark平台的中间数据负载平衡设计
3.1 系统框架概述
3.1.1 系统流程
3.1.2 数据倾斜模型
3.2 抽样算法设计
3.2.1 蓄水池抽样算法
3.2.2 cluster大小预测
3.3 分割组合算法设计
3.3.1 过程描述
3.3.2 算法分析
3.4 本章小结
第4章 实验分析与性能评估
4.1 实验环境
4.2 实验方案
4.3 实验结果与分析
4.3.1 抽样实验分析
4.3.2 Sort Benchmark测试分析
4.3.3 Text Search Benchmark测试分析
4.3.4 Word Count Benchmark测试分析
4.3.5 整体执行时间性能分析
4.4 本章小结
结论
参考文献
致谢
攻读硕士学位期间所发表的学术论文目录
湖南大学;