声明
摘要
第1章 绪论
1.2 本文工作
1.3 论文结构
第2章 相关技术
2.1 MapReduce计算模型
2.2 Hadoop MapReduce
2.2.1 MapReduce v1
2.2.2 MapReduce v2
2.3 大数据处理技术
2.4 ETL技术
2.5 本章小结
第3章 系统架构
3.1 EasyWrangling系统概述
3.2 EasyWrangling脚本执行引擎架构
3.3 数据模型
3.4 数据操作
3.4.1 基础转换操作
3.4.2 高级转换操作
3.5 本章小结
第4章 脚本执行流程
4.3 执行计划树
4.4 MapReduce作业的生成
4.4.1 数据操作的MapReduce实现
4.5 本章小结
第5章 性能优化
5.1.2 操作合并
5.1.3 连接优化
5.2 多个数据转换脚本的执行优化
5.2.1 执行计划图构建
5.2.2 基于输入共事的数据操作合并
5.2.3 运行时执行计划优化器
5.3 本章小结
第6章 实验
6.3 实验数据
6.4 综合比较
6.5 性能优化实验
6.5.1 单个数据转换脚本执行
6.6 实验结果分析
6.6.1 单个数据转换脚本执行
6.6.2 多个数据转换脚本执行
6.7 本章小结
7.1 总结
7.2 展望
参考文献
攻读硕士学位期间的主要研究成果
致谢