声明
1 绪论
1.1研究背景
1.2研究目的及意义
1.3研究现状
1.4论文主要的工作
1.5论文各章节安排
2相关技术
2.1 HBase技术基础
2.1.1 Hadoop平台
2.1.2 HDFS体系结构
2.1.3 HBase整体架构
2.2 线性化技术
2.3 多维索引结构
2.3.1 多维索引结构
2.3.2 最长公共前缀命名方案
2.4 多维索引方案MD-HBase
2.4.1 MD-HBase基础
2.4.2 MD-HBase整体结构
2.4.3 MD-HBase索引结构
2.5 MD-HBase的查询分析
(1) 子空间查找和点查询
(2)插入操作
(3)范围查询
(4)k近邻查询
2.6 本章小结
3 New-grid数据分发和索引框架
3.1 New-grid整体架构设计
3.2填充曲线Hilbert曲线的方案
3.3 基于覆盖网络P-grid的优化构造算法
3.3.1覆盖网络P-grid的介绍
3.3.2覆盖网络P-grid构造算法的优化
3.3.3 P-grid的优化搜索查询
3.4 数据存储层
3.4.1键值存储层Apache HBase
3.4.2存储模型
3.5 数据查询与处理的算法优化
3.5.1数据插入和点查询
3.5.2范围查询处理
3.5.3 k近邻查询查询处理
3.6 实验设计与分析
3.6.1 实验环境
3.6.2 实验方案
3.6.3 实验及分析
3.6.4 实验结论
3.7 本章小结
4 基于机器学习的HBase配置参数优化
4.1 参数问题
4.1.1 HBase配置参数介绍
4.1.2 HBase应用程序的数据流
4.1.3 参数问题分析
4.2基于随机森林算法的模型建立
4.2.1随机森林算法原理
4.2.2性能模型的建立
4.3基于遗传算法的参数优化搜索
4.3.1遗传算法原理
4.3.2自动参数最优搜索
4.4 实验设计与分析
4.4.1 实验环境
4.4.2 实验方案
4.4.3 实验及分析
4.3.4 实验结论
4.4 本章小结
5 总结与展望
5.1 总结
5.2 展望
参考文献
个人简历、在校期间研究成果
致谢
郑州大学;