首页> 外国专利> Determining document subject by using title and anchor text of related documents

Determining document subject by using title and anchor text of related documents

机译:使用相关文档的标题和锚文本确定文档主题

摘要

A system and method identifies a subject for a source document. The system and method identifies a collection of peer documents from the same domain as the source document. For each of the peer documents, a collection of linking documents containing a hyperlink to the peer document is identified. For each of the peer documents, a label is generated by choosing the longest-match anchor text of the linking documents. A pattern between the labels and the titles of the collection of peer documents is deduced. The subject of the source document is identified by applying the pattern to the title of the source document.
机译:一种系统和方法识别源文档的主题。该系统和方法从与源文档相同的域中识别对等文档的集合。对于每个对等文档,标识包含对等文档超链接的链接文档的集合。对于每个对等文档,通过选择链接文档中最长匹配的锚文本来生成标签。得出标签和对等文档集合的标题之间的模式。通过将模式应用于源文档的标题来标识源文档的主题。

著录项

  • 公开/公告号US7590628B2

    专利类型

  • 公开/公告日2009-09-15

    原文格式PDF

  • 申请/专利权人 SHUBIN ZHAO;

    申请/专利号US20060394610

  • 发明设计人 SHUBIN ZHAO;

    申请日2006-03-31

  • 分类号G06F17/00;

  • 国家 US

  • 入库时间 2022-08-21 19:32:57

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号