首页> 外文期刊>Information Fusion >Scalable entity resolution for Web product descriptions
【24h】

Scalable entity resolution for Web product descriptions

机译:用于Web产品描述的可扩展实体分辨率

获取原文
获取原文并翻译 | 示例
获取外文期刊封面目录资料

摘要

Consumers are increasingly using the Web to find product information and make online purchases. This is reflected by the ongoing growth of worldwide e-commerce sales figures. Entity resolution is an important task that supports many services that have arisen from this growth, such as Web shop aggregators. In this paper, we propose a scalable framework for multi-source entity resolution. Our blocking approach employs model words to produce blocks that make our solution highly effective and efficient for the considered domains. An in-depth evaluation, performed using millions of experiments and three large datasets (on consumer electronics and software products), shows that our model words-based approach outperforms other approaches in most cases. Furthermore, we also evaluate our approach with an imperfect similarity function and find that model words-based blocking schemes provide the best blocks with respect to the F-1-measure.
机译:消费者越来越多地使用网络来查找产品信息并进行在线购物。 这反映在全球电子商务销售数据的持续增长。 实体解析是一项重要的任务,支持来自此增长的许多服务,例如Web Shop聚合器。 在本文中,我们提出了一种用于多源实体分辨率的可扩展框架。 我们的阻止方法采用模型单词来生产块,使我们的解决方案对所考虑的域具有高度有效和高效。 使用数百万实验和三个大型数据集(对消费电子产品和软件产品)进行了深入的评估,表明我们的模型基于词语在大多数情况下优于其他方法。 此外,我们还通过不完美的相似性函数评估我们的方法,并发现基于模型的块的阻塞方案提供了关于F-1测量的最佳块。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号