声明
摘要
第1章 绪论
1.1 研究背景
1.2 相关问题的研究现状
1.2.1 面向多核处理器的数据库优化
1.2.2 Cache敏感算法研究现状
1.2.3 MapReduce Join算法研究现状
1.3 本文的主要研究内容和贡献
1.4 本文的组织
第2章 相关背景知识
2.1 计算机存储结构
2.1.1 Cache和内存层次
2.1.2 虚拟内存和地址转换
2.1.3 多核和多线程并行
2.2 MapReduce编程模型
2.2.1 工作原理
2.2.2 模型的不同实现
2.2.3 模型的应用
2.3 内存Hash连接算法
2.3.1 标准Hash连接算法
2.3.2 基于划分的Hash连接
2.3.3 Radix-Join
2.4 本章小结
第3章 面向多核处理器的聚集连接优化
3.1 面向多核的并行聚集连接
3.1.1 面向多核的Hash并行连接
3.1.2 面向多核的Sort-Merge并行连接
3.2 算法的进一步优化
3.2.1 并行MCJoin优化
3.2.2 并行MCSM优化
3.3 实验模拟及结果分析
3.3.1 实验数据
3.3.2 实验设置
3.3.3 实验结果与分析
3.4 本章小结
第4章 基于MapReduce的数据聚集连接
4.1 面向多核结构的MapReduce系统
4.1.1 系统简介
4.1.2 系统的整体框架
4.2 朴素的MapReduce Join算法
4.2.1 数据划分
4.2.2 Map阶段
4.2.3 Reduce阶段
4.3 改进的MapReduce Join算法
4.3.1 数据划分优化
4.3.2 Map阶段优化
4.3.3 Reduce阶段优化
4.4 实验及结果分析
4.4.1 实验设置
4.4.2 实验数据
4.4.3 实验结果及分析
4.5 本章小结
第5章 总结与展望
5.1 本文总结
5.2 将来进一步工作
参考文献
致谢
在读期间发表的学术论文与取得的其他研究成果