封面
声明
答辩决议书
中文摘要
英文摘要
目录
1 绪论
1.1 论文背景与意义
1.2 国内外研究现状
1.3 研究目标和内容
1.4论文结构安排
1.5 本章总结
2 相关技术分析
2.1 HDFS分布式文件系统
2.2 MapReduce计算框架
2.3 二维表数据存储技术
2.4 数据仓库Hive
2.5 本章总结
3 Hive存储结构的改进方案
3.1 Hive存储结构存在的问题
3.2 改进的存储结构FOSF的总体方案
3.3 基于多级元数据信息的列式索引算法
3.4 针对数据分布规律的自适应压缩算法
3.5 本章总结
4 FOSF的设计和实现
4.1 FOS F的列式索引算法IndeFi lter
4.2 FOS F的针对数据分布规律的自适应压缩算法
4.3 FOS F在Hive中的实现
4.4 本章总结
5 FOSF的测试和应用验证
5.1 TPC-H测试
5.2 应用验证
5.3 本章总结
6 总结与展望
6.1 本文工作总结
6.2 下一步工作
参考文献
致谢
攻读学位期间发表的学术论文目录