首页> 外国专利> Method, apparatus and computer program for detecting deviations in data sources

Method, apparatus and computer program for detecting deviations in data sources

机译:用于检测数据源中的偏差的方法,装置和计算机程序

摘要

The present disclosure describes a method and an apparatus for detecting deviations in data sources, each data source comprising a plurality of data posts, each data post comprising a number of data values. The method comprises identifying (102) data post pairs, each pair comprising a first data post in a first data source and a second data post in a second data source, wherein, for a unique matching data attribute of the first data post and the second data post in a data post pair, a subset of the data value is equal. The method further comprises determining (104) whether individual of a plurality of combinations of data values of the first data post with data values of the second data post within each of the plurality of data post pairs fulfill individual of a plurality of relation pattern algorithms, and determining (106) a conformity level for the determined fulfillment of relation pattern algorithms for the plurality of data post pairs. The method further comprises selecting (108) relation pattern algorithm from the plurality of relation pattern algorithms based on the determined conformity level, and analyzing (110) data value combinations of individual data post pairs in relation to the selected relation pattern algorithm in order to detect data value combinations of individual data post pairs that does not conform to the selected relation pattern algorithm, a non-conformance indicating (114) a possible deviation in data of the individual data post pair.
机译:本公开描述了一种用于检测数据源中的偏差的方法和设备,每个数据源包括多个数据柱,每个数据柱包括多个数据值。该方法包括识别( 102 )个数据发布对,每个对包括第一数据源中的第一数据发布和第二数据源中的第二数据发布,其中,对于在数据发布对中的第一数据发布和第二数据发布中,数据值的子集相等。该方法进一步包括确定( 104 )在多个数据帖子对中的每一个内的第一数据帖子的数据值与第二数据帖子的数据值的多个组合中的个体是否满足以下条件的个体:多个关系模式算法,并确定( 106 )符合性级别,以确定所确定的多个数据帖子对对的关系模式算法的实现。该方法还包括基于所确定的一致性级别从多个关系模式算法中选择( 108 )关系模式算法,并分析各个数据的( 110 )数据值组合与所选关系模式算法有关的帖子对,以便检测不符合所选关系模式算法的单个数据帖子对的数据值组合,不符合表示( 114 )各个数据发布对的数据偏差。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号