首页> 外文期刊>ACM Computing Surveys >Blocking and Filtering Techniques for Entity Resolution: A Survey
【24h】

Blocking and Filtering Techniques for Entity Resolution: A Survey

机译:实体解析的阻止和过滤技术:调查

获取原文
获取原文并翻译 | 示例
           

摘要

Entity Resolution (ER), a core task of Data Integration, detects different entity profiles that correspond to the same real-world object. Due to its inherently quadratic complexity, a series of techniques accelerate it so that it scales to voluminous data. In this survey, we review a large number of relevant works under two different but related frameworks: Blocking and Filtering. The former restricts comparisons to entity pairs that are more likely to match, while the latter identifies quickly entity pairs that are likely to satisfy predetermined similarity thresholds. We also elaborate on hybrid approaches that combine different characteristics. For each framework we provide a comprehensive list of the relevant works, discussing them in the greater context. We conclude with the most promising directions for future work in the field.
机译:实体分辨率(ER)是数据集成的核心任务,检测到与相同的实际对象对应的不同实体配置文件。 由于其固有的二次复杂性,一系列技术加速了它,以便它缩放到庞大的数据。 在本调查中,我们审查了两个不同但相关框架下的大量相关工程:阻止和过滤。 前者将比较对更有可能匹配的实体对的比较,而后者识别可能满足预定相似度阈值的快速实体对。 我们还详细阐述了结合不同特征的混合方法。 对于每个框架,我们提供了相关工作的全面列表,在更大的背景下讨论它们。 我们以最有希望的方向为该领域的工作结束。

著录项

  • 来源
    《ACM Computing Surveys》 |2021年第2期|31.1-31.42|共42页
  • 作者单位

    Natl & Kapodistrian Univ Athens Univ Campus Athens 15784 Greece;

    IMIS Res Ctr Athena Artemidos 6 & Epidavrou Maroussi 15125 Greece;

    Katholieke Univ Leuven Dept Comp Sci CODeS Gebroeders Smetstr 1 B-9000 Ghent Belgium;

    Univ Paris French Univ Inst IUF 45 Rue St Peres F-75006 Paris France;

  • 收录信息 美国《科学引文索引》(SCI);美国《工程索引》(EI);
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

    Blocking; filtering; entity resolution;

    机译:阻止;过滤;实体分辨率;

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号