基于HBase的多维索引查询机制的优化研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

移动设备的广泛使用和用户位置信息的实时可用性正在促进新的个性化、基于位置的应用程序和服务(LBSs)的开发。此类应用程序需要能够实现多属性查询、实时查询、大数据分析及支持数百万用户的可伸缩性。新一代的分布式数据库从大量数据中提取值，同时具有高可用性、容错性和可伸缩性，因此提供了非常需要的基础设施来支持LBSs。但是，它不能有效地处理多维数据上的复杂查询，因为它们不提供访问多个属性的方法。因而，为实现多维查询以及提高实时查询效率，本文对基于HBase的多维索引机制以及优化策略进行了研究，主要工作如下： (1)提出了New-grid方案，一个基于HBase的统一的索引和数据分发框架，它利用键值存储来支持多维查询。首先，对P-grid进行了改进，在覆盖网络中组织了一组节点，使其能够提供有效的数据分布、容错和多维数据的查询处理。其次，为了建立索引，使用了基于Hilbert空间填充曲线的线性化技术，该技术保留了数据的局部性，有效地管理键值存储中的多维数据。最后，优化了动态处理范围查询和k近邻查询的算法，这消除了单独索引表的维护开销。该方法完全独立于底层存储层，可以在任何云基础设施上实现。 (2)提出了基于HBase的自动配置参数调优方案，HBase有许多影响系统性能的配置参数，这些参数之间以复杂的方式相互影响，使得手动调整它们以获得最佳性能变得极其困难。底层配置参数优化的关键问题是建立以配置参数为输入的低成本的精确性能模型。通过分析和研究，新方案中使用随机森林算法来构建性能模型，并结合遗传算法及性能模型为HBase应用系统搜索最优配置参数从而提高HBase的性能。 (3)搭建了Hadoop实验平台，通过实验验证了所提出的多维查询方案和参数调优方案的有效性和效率。实验结果表明，New-grid方案可以有效提高基于Hbase的多维数据查询效率，参数调优方案可以提高HBase的性能。

著录项

作者
谭玉龙;
展开▼
作者单位

郑州大学;

展开▼
授予单位郑州大学;
学科计算机科学与技术
授予学位硕士
导师姓名徐江峰;
年度 2019
页码
总页数
原文格式 PDF
正文语种中文
中图分类计算技术、计算机技术;交通工程与公路运输技术管理;
关键词
多维索引; 查询机制;

相似文献

中文文献
外文文献
专利

1. 基于HBase的多维索引查询机制的优化 [J] . 徐江峰 ,谭玉龙 . 计算机应用 . 2020,第002期
2. HiBase：一种基于分层式索引的高效 HBase 查询技术与系统 [J] . 葛微 ,罗圣美 ,周文辉 . 计算机学报 . 2016,第001期
3. 大数据环境下基于Hbase的分布式查询优化研究 [J] . 杜晓东 . 计算机光盘软件与应用 . 2014,第008期
4. 基于HBase的海量冠字号码多维索引研究 [J] . ZHANG Yi ,ZHANG Chongyang . 计算机与数字工程 . 2019,第001期
5. 基于查询索引树的多维连续查询计算方法 [J] . 刘青宝 ,侯东风 . 信息工程大学学报 . 2012,第001期
6. 基于HBase Geohash索引的邻近车辆查询算法 [C] . FANG Jun ,房俊 ,SHEN Dan-dan . 第六届中国计算机学会服务计算学术会议 . 2015
7. 基于HBase的多维索引及维护方法研究 [A] . 周桂平 . 2020

基于HBase的多维索引查询机制的优化研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅