首页> 中国专利> 超大数据集的合并方法及装置

超大数据集的合并方法及装置

摘要

本发明提供了一种超大数据集的合并方法及装置,涉及数据处理技术领域,用于解决现有技术中超大数据集的合并效率偏低的问题。本发明提供的方法及装置基于分布式计算实现,包括:将第一数据集的第一关联主键转换为预设字段类型的数据后根据第一关联主键对第一数据集进行分片,获取预设数量的第一数据分片并将其缓存至预设缓存系统;将第二数据集的第二关联主键转换为预设字段类型的数据后根据第二关联主键对第二数据集进行分片,获取预设数量的第二数据分片;从预设缓存系统中读取第一数据分片,对第一数据分片和第二数据分片进行匹配,并将匹配后的第一数据分片和第二数据分片进行合并。本发明能够用于对超大数据集进行合并。

著录项

  • 公开/公告号CN109033295B

    专利类型发明专利

  • 公开/公告日2021-07-02

    原文格式PDF

  • 申请/专利号CN201810772324.5

  • 发明设计人 史贵振;高福海;张莹莹;

    申请日2018-07-13

  • 分类号G06F16/25(20190101);G06F16/2455(20190101);

  • 代理机构11274 北京中博世达专利商标代理有限公司;

  • 代理人申健

  • 地址 610213 四川省成都市天府新区华阳街道天府大道南段846号

  • 入库时间 2022-08-23 12:04:09

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号