首页> 中国专利> 一种建立用于大数据分析的中间数据仓库的方法及系统

一种建立用于大数据分析的中间数据仓库的方法及系统

摘要

本发明公开了一种建立用于大数据分析的中间数据仓库的方法,其特征在于,所述方法包括:将所有历史数据加载到HBase表中,针对数据会有更新和大数据平台数据不可变更原则,使用HBase数据仓库记录发生变化的记录数据;根据需要进行关联查询的字段和有效字段选择HBase表中的最新记录数据作为待存储的记录数据;根据待存储的记录数据在中间数据仓库中创建Hive表,并将所述待存储的记录数据存储到Hive表中;以及利用Hive表进行Spark关联查询。本发明的有益效果在于:本发明使用了HBase表和Hive表的优势,在大数据平台数据不可变的情况下,使用可以动态变化的HBase表存储大量的需变化的数据,Hive表获取HBase表的最新数据作为关联查询的表,提高大数据平台处理数据的速度。

著录项

  • 公开/公告号CN108255838B

    专利类型发明专利

  • 公开/公告日2022-02-18

    原文格式PDF

  • 申请/专利权人 航天信息股份有限公司;

    申请/专利号CN201611237526.7

  • 申请日2016-12-28

  • 分类号G06F16/22(20190101);G06F16/28(20190101);

  • 代理机构11266 北京工信联合知识产权代理有限公司;

  • 代理人郭一斐

  • 地址 100195 北京市海淀区杏石口路甲18号航天信息园

  • 入库时间 2022-08-23 13:08:24

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号