首页> 外国专利> Self-analyzing data processing job to determine data quality issues

Self-analyzing data processing job to determine data quality issues

机译:自我分析数据处理工作以确定数据质量问题

摘要

Techniques are disclosed to determine data quality issues in data processing jobs. The data processing job is received, the data processing job specifying one or more processing steps designed based on one or more data schemas and further specifies one or more desired quality metrics to measure at the one or more processing steps. One or more state machines are provided, that are generated based on the quality metrics and on the data schemas. Input data to the data process job are processed using the one or more state machines, in order to generate output data and a set of data quality records characterizing a set of data quality issues identified during the execution of the data processing job.
机译:公开了确定数据处理作业中的数据质量问题的技术。接收数据处理作业,该数据处理作业指定基于一个或多个数据模式设计的一个或多个处理步骤,并且进一步指定一个或多个期望的质量度量以在一个或多个处理步骤进行测量。提供了一个或多个状态机,这些状态机是根据质量指标和数据模式生成的。使用一个或多个状态机处理到数据处理作业的输入数据,以生成输出数据和一组数据质量记录,这些记录表征了在执行数据处理作业期间识别出的一组数据质量问题。

著录项

  • 公开/公告号US9576037B2

    专利类型

  • 公开/公告日2017-02-21

    原文格式PDF

  • 申请/专利权人 INTERNATIONAL BUSINESS MACHINES CORPORATION;

    申请/专利号US201414224864

  • 发明设计人 JEFF J. LI;YONG LI;

    申请日2014-03-25

  • 分类号G06F7/00;G06F17/00;G06F17/30;

  • 国家 US

  • 入库时间 2022-08-21 13:43:37

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号