面向 HBase 的大规模数据加载研究

贺正红; 周娅; 文缔尧; 吴清霞

首页> 中文期刊> 《计算机系统应用》 >面向 HBase 的大规模数据加载研究

面向 HBase 的大规模数据加载研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

团队文献服务 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

分布式数据库 HBase 在大规模数据加载中较传统关系型数据库有较大的优势但也存在很大的优化空间。基于 Hadoop 分布式平台搭建 HBase 环境，并优化自定义数据加载算法。首先，分析 HBase 底层数据存储，实验得出 HBase 自带数据加载方式在效率和灵活性方面存在不足；进而，提出了自定义并行数据加载算法，并针对集群进行优化。实验结果表明，优化后的自定义并行数据加载方式能充分发挥集群性能，具有较好的加载效率和数据操作能力。%Distributed database HBase has the greater advantage than traditional relational database in large scale data loading but there is also a lot of optimization space. We build HBase environment based on the Hadoop distributed platform, and optimize self-defining data loading algorithm. Firstly, this paper analysis the HBase underlying data store, experiments work out that data loading methods of HBase are insufficient in efficiency and flexibility. Furthermore, it proposes self-defining parallel data loading algorithm, and optimizes the cluster. The experimental results show that the optimized self-defining parallel data loading method can give full play to the cluster performance, has good loading efficiency and data operational capacity.

著录项

来源
《计算机系统应用》 |2016年第6期|231-237|共7页
作者
贺正红; 周娅; 文缔尧; 吴清霞;
展开▼
作者单位

桂林电子科技大学计算机科学与工程学院;

桂林 541004;

桂林电子科技大学计算机科学与工程学院;

桂林 541004;

桂林电子科技大学计算机科学与工程学院;

桂林 541004;

桂林电子科技大学计算机科学与工程学院;

桂林 541004;

展开▼
原文格式 PDF
正文语种 chi
中图分类
关键词
HBase ; Hadoop ; MapReduce ; 数据加载 ; 性能优化 ;

相似文献

中文文献
外文文献
专利

1. 基于HBase的大规模无线传感网络数据存储系统 [J] . 陈庆奎 ,周利珍 . 计算机应用 . 2012 ,第007期
2. 面向日志结构化数据存储的高效数据加载 [J] . 丁国浩 ,徐辰 ,钱卫宁 . 华东师范大学学报（自然科学版） . 2019 ,第005期
3. 面向对象的城市建筑物点云数据加载和组织 [J] . 路兴昌 ,张艳红 ,张爱武 . 计算机工程 . 2008 ,第009期
4. 一种面向智能交通场景的HBase时空索引设计 [J] . 刘一流 . 电脑知识与技术 . 2020 ,第004期
5. 面向大数据存储的HBase二级索引设计 [J] . 李斌 ,郭景维 ,彭骞 . 计算技术与自动化 . 2019 ,第002期
6. 阿里云大规模结构化云存储HBase架构解析 [C] . 封神 . 2017中国大数据技术大会 . 2017
7. 基于HBase的大规模RDF数据存储与检索技术的研究与实现 [A] . 张珂 . 2017

面向 HBase 的大规模数据加载研究

摘要

著录项

相似文献

相关主题

期刊订阅