1 绪论
1.1 本文研究背景与意义
1.2 国内外相关研究
1.3论文主要内容和各章安排
2 关键技术和概念介绍
2.1 Hadoop生态系统
2.2 Hive数据仓库
2.3 本章小节
3 海量Web日志数据的存储和处理
3.1 传统方式的数据存储
3.2 传统方式的数据处理
3.3 分布式设计的优势
3.4 本章小节
4 基于Hive的Web日志数据系统构建
4.1 数据存储模型设计
4.2 分布式集群的搭建
4.3 数据采集
4.4 数据存储
4.5 数据处理
4.6 相关参数设置优化
4.7 本章小节
5 系统分析与测试
5.1 Web日志数据处理测试
5.2日志数据处理的高效性
5.3本章小节
6 总结与展望
6.1 论文工作总结
6.2 工作展望
参考文献
致谢
作者从事科学研究和学习经历简介
攻读硕士学位期间主要成果