首页> 外文会议>Telecommunications Forum >Different similarity measures to identify duplicate records in relational databases
【24h】

Different similarity measures to identify duplicate records in relational databases

机译:在关系数据库中识别重复记录的不同相似性度量

获取原文

摘要

There are various methods for the identification of duplicate records. Besides the importance of methods quality, the choice of similarity measures is very important for data comparison used in those methods. There are four kinds of similarity measures tested and analysed in this paper to identify duplicate records in relational databases. On the basis of the obtained results, the paper gives conclusions with recommendations for further research in this area.
机译:识别重复记录的方法有很多种。除了方法质量的重要性外,相似性度量的选择对于这些方法中使用的数据比较也非常重要。本文对四种相似性度量进行了测试和分析,以识别关系数据库中的重复记录。在获得的结果的基础上,本文给出了结论,并提出了在该领域进一步研究的建议。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号