【24h】

Discovering missing links in Wikipedia

机译:在维基百科中发现丢失的链接

获取原文
获取原文并翻译 | 示例

摘要

In this paper we address the problem of discovering missing hypertext links in Wikipedia. The method we propose consists of two steps: first, we compute a cluster of highly similar pages around a given page, and then we identify candidate links from those similar pages that might be missing on the given page. The main innovation is in the algorithm that we use for identifying similar pages, LTRank, which ranks pages using co-citation and page title information. Both LTRank and the link discovery method are manually evaluated and show acceptable results, especially given the simplicity of the methods and conservativeness of the evaluation criteria.
机译:在本文中,我们解决了在Wikipedia中发现丢失的超文本链接的问题。我们提出的方法包括两个步骤:首先,我们围绕给定页面计算一组高度相似的页面,然后从给定页面上可能缺少的那些相似页面中识别候选链接。主要创新之处在于我们用于识别相似页面的算法LTRank,该算法使用共引和页面标题信息对页面进行排名。手动评估LTRank和链接发现方法并显示可接受的结果,尤其是考虑到方法的简单性和评估标准的保守性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号