首页> 外国专利> System and method for indexing web content using click-through features

System and method for indexing web content using click-through features

机译:使用点击功能为网页内容编制索引的系统和方法

摘要

System and method for the determination of the relevance of a content item to a query through the use of a machine learned relevance function that incorporates click-through features of the content items. A method for selecting a relevance function to determine a relevance of a query-content item pair comprises generating training set having one or more query-URL pairs labeled for relevance based on their click-through features. The labeled query-URL pairs are used to determine the relevance function by minimizing a loss function that accounts for click-through features of the content item. The computed relevance function is then applied to the click-through features of unlabeled content items to assign relevance scores thereto. An inverted click-through index of query-score pairs is formed and combined with the content index to improve relevance of search results.
机译:用于通过使用机器学习的关联功能来确定内容项与查询的相关性的系统和方法,该功能结合了内容项的点击功能。一种用于选择相关性函数以确定查询-内容项对的相关性的方法,包括生成训练集,该训练集具有一个或多个基于其点击特征被标记为相关性的查询-URL对。带标签的查询-URL对用于通过最小化说明内容项的点击功能的损失函数来确定相关性函数。然后将计算出的相关性函数应用于未标记内容项的点击特征,以向其分配相关性分数。形成查询得分对的反向点击索引,并将其与内容索引组合以提高搜索结果的相关性。

著录项

  • 公开/公告号US7647314B2

    专利类型

  • 公开/公告日2010-01-12

    原文格式PDF

  • 申请/专利权人 GORDON SUN;ZHAOHUI ZHENG;

    申请/专利号US20060414405

  • 发明设计人 GORDON SUN;ZHAOHUI ZHENG;

    申请日2006-04-28

  • 分类号G06F7/00;G06F17/30;

  • 国家 US

  • 入库时间 2022-08-21 18:49:58

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号