首页> 外国专利> A METHOD AND SYSTEM FOR INTEGRATING DATA INTO A DATABASE

A METHOD AND SYSTEM FOR INTEGRATING DATA INTO A DATABASE

机译:一种将数据集成到数据库中的方法和系统

摘要

A method and system for integrating data into a database (6) comprises storing data from a plurality of data sources (S1,Si). The system comprises a rule learning module (1 ) and a duplicate elimination module (2). The rule learning module (1 ) operates in an initial rule learning stage. The duplicate elimination module (2) then operates in a de-duplication stage using the learnt rules. The de-duplication rules use conditional probability to determine the probability of records in the data sources (S1,Si) being duplicates of one another. Duplicate records are integrated and stored in the integrated database (6).
机译:将数据集成到数据库中的方法和系统(6)包括存储来自多个数据源(S 1 ,S i )的数据。该系统包括规则学习模块(1)和重复消除模块(2)。规则学习模块(1)在初始规则学习阶段中操作。然后,复制消除模块(2)使用学习到的规则在重复数据消除阶段运行。重复数据删除规则使用条件概率来确定数据源(S 1 ,S i )中记录彼此重复的概率。重复的记录被集成并存储在集成数据库(6)中。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号