首页> 中国专利> 一种基于NiFi更新Delta Lake的方法

一种基于NiFi更新Delta Lake的方法

摘要

本发明特别涉及一种基于NiFi更新Delta Lake的方法。该基于NiFi更新Delta Lake的方法,为保证增量数据的顺序性,以kafka为消息中间件进行存储读取;NiFi处理器启动sparkStreaming程序读取kafka主题数据,并对Delta Lake存储层的数据进行更新;Hive组件通过metastore对Delta Lake存储层创建的表进行关联,从而间接实现对Hive表的更新,即可通过SparkSql进行查询计算。该基于NiFi更新Delta Lake的方法,配置简单,将提交sparkstreaming程序与启动kafka生产者客户端合并为一个处理器,大大减少了使用者的配置复杂度,同时解决了Hive表中更新数据复杂且效率低的问题,能够满足大部分业务的增量需求,运行稳定,开发成本低,具有广泛的应用场景。

著录项

  • 公开/公告号CN112800073A

    专利类型发明专利

  • 公开/公告日2021-05-14

    原文格式PDF

  • 申请/专利权人 浪潮云信息技术股份公司;

    申请/专利号CN202110107924.1

  • 发明设计人 杨贵柽;周永进;李国涛;胡清;

    申请日2021-01-27

  • 分类号G06F16/23(20190101);G06F16/22(20190101);G06F3/0484(20130101);G06F9/54(20060101);

  • 代理机构37100 济南信达专利事务所有限公司;

  • 代理人郗艳荣

  • 地址 250100 山东省济南市高新区浪潮路1036号浪潮科技园S01号楼

  • 入库时间 2023-06-19 10:58:46

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-03-28

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号