首页> 中国专利> 一种消除大数据规范关系连接冗余的优化方法

一种消除大数据规范关系连接冗余的优化方法

摘要

本发明通过对二次排序算法进行优化,重新定义Map阶段的分区过程、Shuffle阶段的排序及分组过程,使得Map阶段的输出为包含一方关系属性值和多方关系排序值的组合键及包含多方关系属性值的集合,Reduce阶段将组合键进行分解,提取一方关系的主码作为HBase表的行键,并将组合键中一方关系的各个属性值,多方关系属性值集合及排序后的连接结果分别写入HBase表中对应的列,从而既实现了连接的语义,又消除了冗余,由于以HBase表存储连接结果,从而可以利用HBase提供的各类方法进行数据检索,提高了对连接结果的查询效率。

著录项

  • 公开/公告号CN107506394B

    专利类型发明专利

  • 公开/公告日2020-05-29

    原文格式PDF

  • 申请/专利权人 武汉工程大学;

    申请/专利号CN201710638243.1

  • 发明设计人 刘黎志;

    申请日2017-07-31

  • 分类号G06F16/2453(20190101);G06F16/22(20190101);G06F16/2458(20190101);G06F16/28(20190101);

  • 代理机构33228 宁波市鄞州甬致专利代理事务所(普通合伙);

  • 代理人李迎春

  • 地址 430205 湖北省武汉市东湖新技术开发区光谷一路206号

  • 入库时间 2022-08-23 10:59:51

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-05-29

    授权

    授权

  • 2018-01-19

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20170731

    实质审查的生效

  • 2017-12-22

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号