首页> 中国专利> 基于数据湖的异构数据源集成方法及装置

基于数据湖的异构数据源集成方法及装置

摘要

本发明公开了基于数据湖的异构数据源集成方法及装置,其方法包括如下步骤:a、根据用户调用写数据接口的信息,确定本次写请求的操作标示、数据、时间戳,其中操作标示包含追加、更新、删除三种类型,时间戳为写请求达到的时间,将以上信息追加写入到数据湖中的一个特定文件内;b、将上一步写入到特定文件内的数据,结合操作标示及时间戳做数据合并处理,得到最终的结果数据。本发明解决了现有数据湖数据集成技术,无法支持数据更新操作,不能将数据湖的数据和原始数据保持一致,不能有效解决大数据集群大量小文件导致查询性能低效等问题。

著录项

  • 公开/公告号CN111966750A

    专利类型发明专利

  • 公开/公告日2020-11-20

    原文格式PDF

  • 申请/专利权人 北京海致网聚信息技术有限公司;

    申请/专利号CN202010809326.4

  • 发明设计人 翟士丹;

    申请日2020-08-12

  • 分类号G06F16/27(20190101);G06F16/25(20190101);

  • 代理机构

  • 代理人

  • 地址 100083 北京市海淀区学院路甲5号2幢平房B-1011

  • 入库时间 2023-06-19 08:58:14

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-01-25

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号