首页> 中国专利> 一种基于分布式流计算引擎Flink的关键字段实时去重方法

一种基于分布式流计算引擎Flink的关键字段实时去重方法

摘要

本发明实施例公开了一种基于分布式流计算引擎Flink的关键字段实时去重方法。该方法包括:接收目标数据,并基于配置文件确定目标数据中的至少一个待去重关键字段;其中,目标数据为结构化数据;配置文件中包括与目标数据匹配的待去重关键字段;基于加密算法对各待去重关键字段进行加密确定加密数据;基于Flink设置计时器,以计时器中的起始时间为起始时间点,在计时器中的去重持续时间内,采用布隆过滤器对加密数据进行去重。通过执行本方案,可以实现对海量数据的关键字段进行高效地实时去重,可以节约存储空间,提高数据处理效率。

著录项

  • 公开/公告号CN114048201A

    专利类型发明专利

  • 公开/公告日2022-02-15

    原文格式PDF

  • 申请/专利权人 北京锐安科技有限公司;

    申请/专利号CN202111352389.2

  • 发明设计人 任丽超;张俊杰;冯宇波;毛勇岗;

    申请日2021-11-16

  • 分类号G06F16/215(20190101);G06F16/2455(20190101);G06F21/60(20130101);

  • 代理机构11332 北京品源专利代理有限公司;

  • 代理人苏舒音

  • 地址 100044 北京市海淀区西小口路66号中关村东升科技园北领地B-2号楼七层

  • 入库时间 2023-06-19 14:12:50

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-03-04

    实质审查的生效 IPC(主分类):G06F16/215 专利申请号:2021113523892 申请日:20211116

    实质审查的生效

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号