首页> 中国专利> 基于跟踪到的用户偏好对搜索结果进行分级的系统和方法

基于跟踪到的用户偏好对搜索结果进行分级的系统和方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

提供了一种用于基于用户偏好对搜索结果进行分级的方法和系统。该方法包括监视用户响应于用户接收搜索结果的选择，和对显示阈值满意程度的用户选择跟踪与用户选择相关的元数据。该方法还包括将跟踪到的元数据存储为用户偏好，以及调整分级机制来增加用户偏好的权重，用以提升显示用户偏好的搜索结果的等级。该方法还包括在确定用户选择超过阈值满意程度之后存储用户选择和关键字搜索。该方法可以在接收到一重复搜索之后利用所存储的用户选择和关键字搜索，来改变新搜索结果对用户的显示。

著录项

公开/公告号CN1716257A

专利类型发明专利
公开/公告日2006-01-04

原文格式PDF
申请/专利权人微软公司;
展开▼

申请/专利号CN200510082425.2
发明设计人 R·纳姆;
展开▼

申请日2005-06-29
分类号G06F17/30(20060101);G06Q10/00(20060101);
代理机构31100 上海专利商标事务所有限公司;
代理人沈昭坤
地址美国华盛顿州
入库时间 2023-12-17 16:55:11

法律信息

法律状态公告日

法律状态信息

法律状态
2015-05-20

专利权的转移 IPC(主分类):G06F17/30 变更前: 变更后: 登记生效日:20150430 申请日:20050629

专利申请权、专利权的转移
2009-07-15

授权

授权
2007-08-22

实质审查的生效

实质审查的生效
2006-01-04

公开

公开

说明书

(1)技术领域

本发明的实施例涉及对搜索结果进行分级的系统和方法。更具体而言，本发明的实施例涉及基于用户偏好对搜索结果进行分级的技术。

(2)背景技术

计算机搜索，尤其是通过因特网的搜索，是一种寻找信息的普遍技术。搜索引擎通常基于用户输入的词产生结果。搜索引擎通常基于查找到的词与用户输入的词的相似度对结果进行排序或分级。显示与用户输入的请求相同的单词和单词顺序的结果通常会被给予高等级，且位于呈现给用户的列表的顶端附近。

大多数目前已知技术的一个问题是无法说明用户偏好。给定一个特定的查询，输入该查询的每个用户都会收到相同的结果。

因而，web服务日益接近于定制他们提供给各个用户的信息。尽管某些已知系统能够说明用户偏好，然而仍要求用户亲自且主动输入偏好。在没有明确的用户定制的情况下，目前已知系统没有能力根据用户偏好自动对搜索结果进行分级。

为使因特网搜索引擎能够提供最优结果，它应该考虑关于提出查询的顾客以往行为的信息。从而，需要一种解决方案，用以提供有效地跟踪关于用户行为的信息，并利用跟踪到的信息向该特定用户提供最相关结果的方法。以有效的方式个性化由web搜索引擎呈现的数据，可以显著地改进用户搜索体验，从而推进顾客忠诚度和收入。

(3)发明内容

本发明的实施例针对基于用户偏好对搜索结果进行分级的方法。该方法包括监视用户响应于接收搜索结果的选择，以及对于显示阈值满意程度的用户选择跟踪与用户选择相关的元数据。该方法还包括将跟踪到的元数据存储为用户偏好，并调整一分级机制以增加用户偏好的权重，用以提高显示用户偏好的搜索结果的等级。

在本发明的另一方面中，提供了一种基于用户行为改变对搜索结果的显示的方法。搜索结果从一执行用户关键字搜索的核心搜索引擎上获得。该方法包括监视用户响应于接收搜索结果的选择，并在确定用户选择超过了阈值满意程度后，存储该用户选择和关键字搜索。该方法还包括在接收一重复的搜索之后利用存储的用户选择和关键字搜索来更改对用户的新搜索结果呈现。

在本发明的又一方面，提供了一种基于用户偏好对搜索结果进行分级的系统。该系统包括一搜索满意跟踪器，用以监视用户选择和跟踪用户满意；以及一个性化分级器，用以基于跟踪到的用户满意为该用户进行搜索结果分级。

(4)附图说明

本发明参考附图在下文详细描述，附图中：

图1是示出依照本发明的一个实施例的系统的概观的框图；

图2是示出可在其中实现本发明的实施例的计算机化环境的框图；

图3是示出依照本发明的一个实施例的搜索结果个性化系统的框图；

图4是示出依照本发明的一个实施例的搜索满意跟踪器的框图；

图5是示出依照本发明的一个实施例的个性化分级器的框图；

图6是示出使用个性化分级装置来处理搜索请求的方法的流程图；以及

图7是示出依照本发明的一个实施例实现搜索满意跟踪器的技术的流程图。

(5)具体实施方式

I.系统概述

本发明的实施例包括用以对搜索结果的分级进行个性化的方法和系统。图1是示出依照本发明的一个实施例的系统的概观的框图。图1示出了包含有搜索结果个性化系统20的用户计算机10。用户计算机10通过网络220，诸如因特网，同服务器200相连。服务器200可以是实现核心搜索引擎210的web服务器。

响应于用户搜索请求，核心搜索引擎210基于输入词执行搜索。搜索结果个性化系统20接收由搜索引擎定位的结果，并依照通过监视用户行动来跟踪而感知到的用户偏好对该结果进行分级。尽管图1示出了在客户机端的搜索结果个性化系统20，然而搜索结果个性化系统20也可以在服务器端实现。在所示的客户机端实现中，搜索结果个性化系统可以跟踪用户行动，而无须通知服务器端。作为另一可选择的方案，在客户端实现中，搜索结果个性化系统20可以自动将用户偏好附加到每个用户查询。在服务器端模型中，服务器可以按唯一用户标识符(UID)标识用户，并搜索与标识符一起存储的用户偏好。搜索结果个性化系统20的组件结合图3-7在下文进一步描述。

II.示例性操作环境

图2示出了其中可实现搜索结果个性化系统20的合适的计算系统环境100的示例。计算系统环境100仅仅是合适的计算环境的一示例，并不意在对本发明的使用范围或功能提出任何限制。也不应该把计算环境100解释为对在示例性操作环境100中示出的任一组件或其组合有任何依赖或要求。

本发明可在诸如由计算机执行的程序模块等计算机可执行指令的通用语境下描述。一般而言，程序模块包括例程、程序、对象、组件、数据结构等，它们执行特定任务或实现特定抽象数据类型。此外，本领域的技术人员可以理解，本发明可以在其它计算机系统配置下实现，包括手持设备、多处理器系统、基于微处理器或可编程消费者电子产品、小型机、大型机等。本发明也可以在分布式计算环境下实现，其中任务由通过通信网络连接的远程处理设备执行。在分布式计算环境中，程序模块可以位于包括存储器存储设备在内的本地和远程计算机存储介质中。

参考图2，用于实现本发明的示例性系统100包括计算机110形式的通用计算设备，包含处理单元120、系统存储器130和将包括系统存储器在内的各种系统组件耦合至处理单元120的系统总线121。

计算机110通常包括各种计算机可读介质。作为示例，而非限制，计算机可读介质可以包括计算机存储介质和通信介质。系统存储器130包括易失或非易失存储器形式的计算机存储介质，诸如只读存储器(ROM)131和随机存储器(RAM)132。基本输入/输出系统133(BIOS)，包含有助于诸如启动时在计算机110中元件之间传递信息的基本例程，通常存储在ROM 131中。RAM 132通常包含处理单元120可以立即访问和/或目前正在操作的数据和/或程序模块。作为示例，而非限制，图2示出了操作系统134、应用程序135、其它程序模块136和程序数据137。

计算机110也可以包括其它可移动/不可移动、易失性/非易失性计算机存储介质。仅作为示例，图2示出了从不可移动、非易失性磁介质中读取或向其写入的硬盘驱动器141，从可移动、非易失性磁盘152中读取或向其写入的磁盘驱动器151，和从诸如CD ROM或其它光学介质等可移动、非易失性光盘156中读取或向其写入的光盘驱动器155。可以在示例性操作环境下使用的其它可移动/不可移动、易失性/非易失性计算机存储介质包括，但不限于，盒式磁带、闪存卡、数字多功能盘、数字录像带、固态RAM、固态ROM等。硬盘驱动器14通常由不可移动存储器接口，诸如接口140连接至系统总线121，磁盘驱动器151和光盘驱动器155通常由可移动存储器接口，诸如接口150连接至系统总线121。

以上描述和在图2中示出的驱动器及其相关联的计算机存储介质为计算机110提供了对计算机可读指令、数据结构、程序模块和其它数据的存储。在图2中，例如，硬盘驱动器141被描述为存储操作系统144、应用程序145、其它程序模块146和程序数据147。注意到这些组件可以与操作系统134、应用程序135、其它程序模块136和程序数据137相同或不同。操作系统144、应用程序145、其它程序模块146和程序数据147在这里被标注了不同的编号是为了说明至少它们是不同的副本。用户可以通过输入设备，诸如键盘162和定点设备161(通常指鼠标、跟踪球或触摸垫)向计算机110输入命令和信息。其它输入设备(未示出)可以包括麦克风、操纵杆、游戏垫、圆盘式卫星天线、扫描仪等。这些和其它输入设备通常由耦合至系统总线的用户输入接口160连接至处理单元120，但也可以由其它接口或总线结构，诸如并行端口、游戏端口或通用串行总线(USB)连接。监视器191或其它类型的显示设备也经由一接口，诸如视频接口190，连接至系统总线121。除监视器以外，计算机也可以包括其它外围输出设备，诸如扬声器197和打印机196，它们可以通过输出外围接口195连接。

本发明中的计算机110可使用至一个或多个远程计算机，诸如远程计算机180的逻辑连接在网络化环境下运行。远程计算机180可以是个人计算机，且通常包括上文相对于计算机110描述的许多或所有元件，尽管在图2中只显示了存储器存储设备181。图2中所示逻辑连接包括局域网(LAN)171和广域网(WAN)173，但也可以包括其它网络。

当在LAN网络环境中使用时，计算机110通过网络接口或适配器170连接至局域网171。当在WAN网络环境中使用时，计算机110通常包括调制解调器172或通过诸如因特网等WAN 173建立通信的其它装置。调制解调器172可以是内部的或外部的，可以通过用户输入接口160或其它合适的机制连接至系统总线121。在网络化环境中，相对于计算机110所描述的程序模块或其部分可以存储在远程存储器存储设备中。作为示例，而非限制，图2示出了远程应用程序185驻留在存储器设备181上。可以理解，所示的网络连接是示例性的，且可以使用在计算机之间建立通信链路的其它手段。

尽管计算机110的多个其它内部组件没有示出，然而本领域的普通技术人员可以理解，这样的组件和互连是众所周知的。从而，涉及到计算机110内部构造的其它细节不必连同本发明一起揭示。

III.本发明的系统和方法

图3示出了搜索结果个性化系统20的组件。搜索结果个性化系统20可以包括搜索满意跟踪器(SST)30和个性化分级器(PR)50。这两个组件与用户和核心搜索引擎210交互，以根据用户偏好对搜索结果进行分级。

图4示出了依照本发明的实施例的SST 30的组件。SST 30维护基于逐个查询来显示高用户满意的结果的记录。SST 30可以存储用户以往的搜索31和偏好32。以往的搜索和用户偏好可以存储在上文相对于计算机化环境所描述的任一存储结构中。对以往搜索的存储可以包括存储输入词和先前同这些词一起接收到的用户选择。偏好32可以与用户选择的分析相关。例如，偏好32可以反映用户对基于诸如页面语言、长度、场所、文档格式、所属类别和其它属性等特征的文档选择的倾向。

SST 30还可以包括用户监视机制33、统计范数(statistical norm)数据34、满意确定组件35、变更检测器36和元数据跟踪机制38。用户监视机制33向其它SST组件提供关于用户选择的信息。用户监视机制33监视用户对于由核心搜索引擎210提供的搜索结果的行动。

满意确定组件35判断用户被监视的行动是否指示满意。本发明是以根据用户行为推断用户满意为基础的。这可以使用本发明范围之外的任何数量的技术来实现。这些技术可以包括监视用户查看一特定结果的次数或所花费的时间。

变更检测器36利用统计范数数据34来确定满意指示器与存储在统计范数数据34中的统计范数的偏离程度。用户对于搜索结果的满意在某种程度上与在结果集中的位置相关。为效率起见，SST 30只跟踪基于查询结果位置远远偏离于用户满意的统计范数的满意得分。该偏离阈值是可调节的。

元数据跟踪机制38与用户监视机制33交互来跟踪用户发现为满意的选择的特征。被跟踪的元数据可以包括结果文档的特征，基于变更检测器36的判断，用户对该结果文档表现出高度满意。元数据可以包括诸如页面语言、长度、场所、文档格式、所属类别和其它属性等信息。元数据跟踪机制还可以跟踪特定的域，诸如.edu、.gov或.org。元数据跟踪机制38标识统计异常以及页面属性和用户满意之间的显著相关性。例如，如果一用户趋于对PDF文档有高满意要比一般用户频繁得多。该信息会最后被个性化分级器50利用来在对结果分级时提高这些标准的重要度。

图5示出了依照本发明的实施例的个性化分级器(PR)50。PR 50使用来自SST 30的数据来调整对一给定查询的结果的分级。PR 50可以在因特网搜索服务器200或用户计算机10上运行。PR 50使用来自SST 30的数据来调整对一给定查询的结果的分级。个性化分级器50可以包括分级机制52、SST信息交换器54和核心搜索引擎信息交换器56。基于由SST 30通过SST信息交换器54提供的信息，分级机制52确定由核心搜索引擎210提供的任何结果是否应该被提升或提高等级，使得该结果可以在最终提供给用户的搜索结果列表上出现在更接近顶端的位置。

PR 50一般提供两种类型的分级调整。首先，如果搜索是一重复的搜索，则SST 30可拥有与用户满意相关的特定信息。在这种情况下，分级机制52可以提升以往满意的结果。分级机制52会提高顾客在先前同样查询事务中满意的结果的等级。如上所述，SST 30维持以往搜索31中的相关记录。

其次，如果查询不是重复的查询，则SST 30仍可以将由元数据跟踪机制38跟踪到的关于用户偏好的信息存储在偏好32中。响应于该信息的接收，分级机制52可以基于用户满意调整其分级算法权重。分级机制52向搜索引擎210传递其建议或加权调整。基于PR 50的建议，搜索引擎210可以增加分配给在用户满意的查询结果中不成比例地表示的页面属性的权重。

作为上述第一种分级情形的示例，用户可以输入对“fast cars”的重复的查询。当第一次输入该搜索词时，用户可能点击了第三个链接“Fast Cars Magazine”。SST存储了该偏好，并将其传递给PR 50。PR 50可以建议分级调整，以建议将“FastCars Magazine”列为第一结果。或者，PR 50可以建议核心搜索引擎210将链接“Fast Cars Magazine”和任何其它先前选择的链接显示在显示的一完全独立的部分中。

在第二种情形中，搜索可以是一新的非重复搜索。如果用户偏好部分32指出该用户通常从“.edu”站点选择文档，则SST 30会将该信息传递给PR 50。PR 50会增加教育性结果的权重，来提高它们的分级。

图6是示出在处理搜索请求时PR 50的操作的工艺流程的流程图。在步骤602处，接收到搜索请求，并且核心搜索引擎210产生结果。在步骤604处，PR 50查询SST 30，以确定由核心搜索引擎210提供的任何结果是否应该被提升。在步骤606处，PR 50接收到从SST 30处得到的关于是否有任何信息可用的指示。如果有信息可用，SST 30在步骤608处将该信息传递给PR 50。在步骤610处，PR 50实现分级机制52，来提升由SST 30建议的结果。分级机制52可以基于用户满意来调整其分级算法权重。例如，当SST 30标识了一组页面属性(诸如类别、文档类型、文档长度或其它元数据)，对该用户而言，这些属性以实质上且统计上显著地超过其与整个人口的用户满意的相关性的方式与满意相关，SST 30会将这些相关性和它们偏离范数的强度报告给PR 50。分级机制52相应地调整其算法。在步骤612处，PR 50将其结果发送给核心搜索引擎210。从那处起，在SST 30报告在相关性改变或用户作出其它指示之前，PR 50会指示核心因特网搜索引擎210在分级中对这些页面属性给于更大的权重。

图7是示出SST 30的工艺流程的流程图。假设用户提交了一搜索请求并接收到一个结果集，该过程在步骤700处开始。在步骤702处，SST 30监视用户对于所提供的结果集的行动。在步骤704处，SST 30存储与用户选择相关的元数据。这些选择揭示了用户偏好并且被存储在SST 30的用户偏好部分32中，以供将来使用。

在步骤706，SST 30确定用户满意的存在。满意是基于任何数量的因素而找到的，这些因素在本发明范围之外，但可以包括诸如用户选择的结果的数量或用户在回顾一结果上花费的时间长度等因素。如果没有发现满意，该过程结束。如果SST 30在步骤708处找到满意，则SST 30在步骤710处确定对统计范数的变更。例如，SST 30会确定该特定用户的满意程度是否显著地高于一般用户的满意程度。可以设定任意的阈值。

在步骤712处，如果满意程度没有超过当前阈值，则该过程结束。如果满意程度的确超过了当前阈值，则SST 30在步骤714处通过在以往搜索中保存整个搜索和在偏好部分32中保存用户偏好来保存该结果。在步骤716处，SST 30将满意度跟踪结果报告给PR 50。

为使因特网搜索引擎能够提供最佳结果，它必须考虑到关于提交查询的顾客的以往行为的信息。本发明提供了一种有效地跟踪关于用户行为的信息和使用该信息来提供最相关结果的技术。本发明是以从用户行为推断用户满意的能力为基础的。一旦给定该数据，搜索引擎会通过在搜索过程中提升以往满意结果、基于用户满意调整分级算法权重、以及对有相似品位的用户满意的页面进行提升，来提高用户结果的等级。

尽管此处详细示出明描述了本发明的特定实施例，应该理解，可以对本发明进行多种变更和修改，而不偏离本发明的范围和目的。此处描述的实施例在所有方面都是说明性的而非限制性的。在不偏离本发明范围的情况下，替换实施例对于本发明所属领域的技术人员而言将是显而易见的。

根据前述，可以看到，本发明能够很好地适用于达到上文提出的所有目的和目标以及其它优点，它们对于本系统和方法而言是明显且固有的。可以理解，某些特性和子组合是有效的，且可以不参考其它特征和子组合来使用。这是被构想的，且在所附权利要求书的范围之内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 基于跟踪到的用户偏好对搜索结果进行分级的系统和方法 [P] . 中国专利： CN100514330C . 2009.07.15
2. 基于跟踪到的用户偏好对搜索结果进行分级的系统和方法 [P] . 中国专利： CN1716257A . 2006-01-04
3. SYSTEM AND METHOD FOR RANKING SEARCH RESULTS BASED ON TRACKED USER PREFERENCES [P] . 韩国专利： KR101137198B1 . 2012-04-19

机译：基于跟踪的用户偏好进行搜索结果排名的系统和方法
4. SYSTEM AND METHOD FOR RANKING SEARCH RESULTS BASED ON TRACKED USER PREFERENCES [P] . CA2510763C . 2012-07-24

机译：基于跟踪的用户偏好进行搜索结果排名的系统和方法
5. System and method for ranking search results based on tracked user preferences [P] . 美国专利： US7562068B2 . 2009-07-14

机译：基于跟踪的用户偏好对搜索结果进行排名的系统和方法