首页> 中文学位 >基于HBase的大数据存储查询技术研究

【6h】

基于HBase的大数据存储查询技术研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

目录

封面

声明

中文摘要

英文摘要

目录

第一章绪论

1.1 研究背景与意义

1.2 国内外研究状况

1.3 本文主要研究内容与章节安排

第二章大数据处理相关技术

2.1 Hadoop架构结构分析

2.2 HBase

2.3 本章小结

第三章基于HBase的高速存储查询研究

3.1 研究目标

3.2 存储问题的分析

3.3存储问题的解决方案

3.4 查询问题的分析

3.5 查询问题的解决方案

3.6 改进HBase的整体框架及模块说明

3.7 本章小结

第四章改进HBase的验证及结果分析

4.1 实验室环境下HBase的环境搭建

4.2 性能测试与分析

4.3 本章小结

第五章总结与展望

5.1总结

5.2展望

致谢

参考文献

攻硕期间取得的研究成果

展开▼

摘要

在现在的大数据平台上，对非结构化数据的存储需求越来越大，对其数据的读写性能要求也越来越高，传统技术无法满足这些要求。因此本文对大数据处理技术进行研究，选取了以Hadoop为平台的HBase数据库，在HBase的自身之上优化了数据存储系统并拓展了二级索引的功能。
　　针对HBase的数据存储系统，它在导入商品图片、视频信息等这些大对象时，出现严重延迟现象。因此本文对这种情况进行了分析，并设计了存储大对象的存储架构。该框架将大对象数据隔离存储在 HDFS上，回避 HBase本身的Split和Minor Compaction的机制，减少对HBase中其它数据的读写影响，然后把存储的文件地址更新到 HBase大对象列族中，实现大对象的快速查询，接着对大对象数据的列族定制了Flush机制与Compaction机制，以实现对大对象的管理维护。通过对改进的HBase与HBase自身的性能对比，改进的HBase在插入数据时，每条记录仅耗时毫秒级时间，且状态很稳定，在读取速度上也提高了2倍，充分满足了线上实时性的需求。
　　本文另一重点是为HBase拓展了二级索引。由于HBase只支持基于主键的查询，当用户不知主键査询数据时，只能通过全表扫描来获取数据，这种方式效率很低，无法满足实时査询需求。针对这一缺点，本文拓展了二级索引功能。它的实现思想是把建立二级索引的任务分布到各个服务端上，同时保证索引表与对应的主表存储在同一个服务器上，这样查询时只需与对应服务端建立一次连接即可，从而提高了非主键查询速度。通过对增加索引功能的HBase与HBase自身的对比，增加索引功能的HBase虽然在插入数据性能上降低了10％，但是在查询性能上，有了极大的提升。
　　最后在实验室搭建了 Hadoop+HBase+ZooKeeper的集群测试环境，利用淘宝某商家的商品信息记录日志文件作为数据源，实现了对改进后的HBase与 HBase自身的测试对比，最终得出改进后的HBase在存储和查询性能方面都取得很大的提升。

著录项

作者
付文静;
展开▼
作者单位

电子科技大学;

展开▼
授予单位电子科技大学;
学科通信与信息系统
授予学位硕士
导师姓名谢甫珍;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.13;
关键词
大数据; 数据存储系统; 二级索引;

相似文献

中文文献
外文文献
专利

1. 基于HBase的大数据存储设计及高并发查询方法研究 [J] . 王璐 . 信息与电脑 . 2021,第015期
2. 基于HBase的交通大数据存储查询平台的设计及实现 [J] . 褚少鹤 ,周洁 ,王敬平 . 软件 . 2019,第002期
3. 基于HBase/Spark的教学大数据存储及索引模型研究 [J] . 唐立 ,李亚平 ,曲金帅 . 云南民族大学学报（自然科学版） . 2020,第005期
4. 基于Hbase的海底监测视频大数据存储方法 [J] . 王川1 ,曾国荪1 ,丁春玲2 . 计算机科学与应用 . 2019,第007期
5. 基于HBase的森林防火遥感瓦片大数据存储 [J] . 曹梦鸽 ,高心丹 ,程逸群 . 东北林业大学学报 . 2018,第002期
6. 基于HBase的遥感数据分布式存储与查询方法研究 [C] . Jing Weipeng ,景维鹏 ,Tian Dongxue . 2017年全国高性能计算学术年会 . 2017
7. 基于HBase的大数据存储优化设计与性能分析 [A] . 温振蕙 . 2019

代理获取

客服邮箱：kefu@zhangqiaokeyan.com

京公网安备：11010802029741号 ICP备案号：京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有

客服微信
服务号