首页> 中国专利> 一种数据治理实时数据质量检测系统

一种数据治理实时数据质量检测系统

摘要

本发明公开了一种数据治理实时数据质量检测系统,包括HBASE数据库、配置模块、Spark检测模块、统计模块和存储模块,所述HBASE数据库用于数据增量备份表的初始化,所述配置模块配置检测任务,输入任务名称、待检测表、关联规则、任务执行的优先级,所述Spark检测模块接收来自配置模块配置的检测任务,并进行检测,所述统计模块使用自动以累加器的方式对满足检测规则的数据进行检测结果的统计。本发明可处理PB级别数据,检测数据量巨大,采用集群检测方式,响应速度较快,规则灵活支持单字段对规则与单规则多检测,内置多种检测规则,也可支持用户自定义检测,可持续自动检测已配置任务的增量数据,可出具完善的数据质量检测报告。

著录项

  • 公开/公告号CN112115121A

    专利类型发明专利

  • 公开/公告日2020-12-22

    原文格式PDF

  • 申请/专利权人 陕西云基华海信息技术有限公司;

    申请/专利号CN202010938634.7

  • 发明设计人 鲁红军;

    申请日2020-11-20

  • 分类号G06F16/21(20190101);G06F16/22(20190101);G06F16/23(20190101);G06F11/14(20060101);

  • 代理机构11499 北京市浩东律师事务所;

  • 代理人李雁

  • 地址 710000 陕西省西安市高新区高新三路2号海佳云顶商住楼10603室

  • 入库时间 2023-06-19 09:18:22

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号