摘要
Abstract
第一章 绪论
1.1 研究背景
1.2 MapReduce与Hadoop
1.3 MPP架构的PDBMS
1.4 研究动机与目标
1.5 论文结构
第二章 FlexDB的理论基础
2.1 模式
2.2 索引
2.3 计算模型
2.4 数据分布和调度
2.5 性能衡量
2.6 容错能力
2.7 小结
第三章 FlexDB架构设计
3.1 FlexDB设计的整体思路
3.2 FlexDB客户端
3.3 Catalog元数据
3.4 Hadoop集群扩展
3.4.1 PostgreSQL集群
3.4.2 接口扩展
3.5 FlexDB主节点
3.5.1 分析器
3.5.2 优化器
3.5.3 查询计划的生成和执行
3.5.4 快速响应模式
3.5.5 冗错和动态平衡
3.6 与Hive、HadoopDB查询执行引擎的比较
3.7 小结
第四章 FlexDB的分布式查询执行
4.1 存储模型
4.1.1 表的独立水平分割
4.1.2 表的全复制存储
4.1.3 表的协同水平分割存储
4.2 查询模型
4.2.1 DDL语句
4.2.2 DML语句
4.2.3 查询执行
4.3 查询实例分析
4.4 小结
第五章 查询测试与分析
5.1 测试环境
5.1.1 硬件环境
5.1.2 软件环境
5.1.3 数据源
5.2 数据加载
5.3 Grep任务
5.4 选择任务
5.5 聚集任务
5.6 连接任务
5.7 小结
第六章 总结与未来展望
6.1 FlexDB查询执行引擎的改进
6.2 MapReduce Online
6.3 列存储DBMS
6.4 其他
参考文献
致谢
攻读硕士期间发表的论文