封面
声明
中文摘要
英文摘要
目录
第一章 绪论
§1.1研究背景
§1.2 国内外研究现状
§1.3 主要研究内容
§1.4 本文结构
第二章 相关技术与理论
§2.1 HDFS分布式文件系统
§2.2 MapReduce编程模型
§2.3 HBase分布式数据库
§2.4 Hive数据仓库概述
§2.5 Zookeeper协调框架
§2.6 并行化数据聚类理论
§2.7 本章小结
第三章 基于HBase的大规模日志数据加载优化
§3.1 HBase对海量数据的支持
§3.2 HBase数据存储
§3.3 数据加载算法研究
§3.4 实验环境与数据
§3.5 实验与结果分析
§3.6 本章小结
第四章 融合HBase与Hive的大规模日志数据查询优化
§4.1 基于HBase的大规模日志查询算法
§4.2 基于HIVE的大规模日志数据查询算法
§4.3 HBaseQA与HIVEQA对比分析
§4.4 融合HBaseQA与HIVEQA算法的查询优化
§4.5 实验与结果分析
§4.6 本章小结
第五章 大规模日志数据典型应用的算法研究
§5.1 传统KMeans聚类算法
§5.2 改进型KMeans并行聚类算法
§5.3 实验与结果分析
§5.4 本章小结
第六章 总结与展望
§6.1 研究总结
§6.2 展望
参考文献
致谢
作者在攻读硕士期间主要研究成果
桂林电子科技大学;