【24h】

Finding Similar Identities among Objects from Multiple Web Sources

机译:在多个Web源中的对象之间寻找相似的身份

获取原文
获取原文并翻译 | 示例

摘要

When integrating data from multiple Web sources, objects can exist in different formats and structures, making it difficult to identify those that can be matched together. In this paper, we propose an identification approach to finding similar identities among objects from multiple Web sources. In this approach, object identification works like the relational join operation where a similarity function takes the place of the equality condition. This similarity function is based on information retrieval techniques. Our approach differs from others in the literature since it can be used to identify objects more complexly structured (e.g., XML documents) and not only objects with a flat structure such as relations. The effectiveness of our approach is demonstrated by experimental results with real Web data sources from different domains, that reach precision levels above 75%.
机译:当集成来自多个Web来源的数据时,对象可以以不同的格式和结构存在,从而难以识别可以匹配的对象。在本文中,我们提出了一种识别方法,可以从多个Web来源中找到对象之间的相似身份。在这种方法中,对象标识的工作方式类似于关系联接操作,其中相似性函数代替了相等条件。这种相似性功能基于信息检索技术。我们的方法与文献中的其他方法不同,因为它可以用于识别结构更复杂的对象(例如XML文档),而不仅用于识别关系等扁平结构的对象。通过使用来自不同领域的真实Web数据源的实验结果证明了我们方法的有效性,这些数据源的准确度达到75%以上。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号