声明
摘要
插图和附表清单
1 绪论
1.1 课题背景及意义
1.1.1 海量数据的产生
1.1.2 研究数据倾斜的意义
1.2 国内外研究状况
1.3 本文主要研究的内容
1.4 文章组织结构安排
2 MapReduce相关基础知识及概述
2.1 Hadoop平台
2.1.1 产生背景
2.1.2 相关组件
2.1.3 Hadoop的应用
2.1.4 作用和意义
2.2 MapReduce介绍
2.2.1 MapReduce简述
2.2.2 MapReduce框架
2.3 理解MapReduce
2.3.1 拓展一个单词计数程序
2.3.2 相同程序在MapReduce中拓展
2.4 数据倾斜
2.4.1 数据倾斜分析
2.4.2 数据倾斜相关解决方法
3 基于Key分区解决数据倾斜问题
3.1 Hadoop默认分区策略
3.2 基于key分区策略在Hadoop上的处理流程
3.3 分区算法
3.4 Key分区策略在Hadoop上的实现
4 实验及结果分析
4.1 环境配置
4.1.1 硬软件环境
4.1.2 集群的网络环境
4.2 实验结果分析
4.2.1 实验评估一
4.2.2 实验评估二
5 总结与展望
参考文献
致谢
作者简介
安徽理工大学;