首页> 中国专利> 包括按子域线索搜索及按子域提供赞助结果的产生搜索结果的系统

包括按子域线索搜索及按子域提供赞助结果的产生搜索结果的系统

摘要

提供了一种包括按子域(132)搜索及按子域(132)提供赞助结果的产生搜索结果的方法和装置。根据本发明各实施例的搜索系统(100)分析各搜索查询(110)以确定它们是否被路由到子域(130),并呈现包括根据子域基础在子域上提供的赞助命中的结果。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-03-17

    未缴年费专利权终止 IPC(主分类):G06F17/30 专利号:ZL2004800123379 申请日:20040405 授权公告日:20080716

    专利权的终止

  • 2015-04-22

    专利权的转移 IPC(主分类):G06F17/30 变更前: 变更后: 登记生效日:20150331 申请日:20040405

    专利申请权、专利权的转移

  • 2008-07-16

    授权

    授权

  • 2006-08-02

    实质审查的生效

    实质审查的生效

  • 2006-06-07

    公开

    公开

说明书

相关申请

本申请要求对序列号为60/460,458题为“Search System Using Search Subdomain and Hints to Subdomains in Search Query Statements and Sponsored Results ona Subdomain-By-Subdomain Basis”于2003年4月4日提交的美国临时专利申请的35USC§119下的优先权,其揭示在此全部引入作为参考用于全部目的。

技术领域

本发明一般涉及内容检索,尤其涉及用来响应于搜索请求来检索内容的方法和装置。

背景技术

在内容检索系统中,用户做出对内容的请求,并接收匹配该请求的内容。该用户可以是与处理请求和/或将请求转发给其它计算机系统的计算机的用户界面交互的人类用户。该用户也可以是通过程序产生请求的另一个计算机过程或系统。在后者情形中,可能请求计算机用户还将通过程序来处理请求的结果,但也可能是计算机用户做出请求而人类用户是响应的最终接收者,或甚至相反,人类用户做出请求而计算机用户是该响应的最终接收者。

内容检索系统在普遍地使用。一种当今通用的系统被称为因特网,网络的全球互联网,其中网络的节点向可对内容作响应的其它节点发送请求。可用于内容请求的一种协议是超文本传输协议(HTTP),其中HTTP客户机(诸如浏览器)对由统一资源定位符(URL)引用的内容做出请求,而HTTP服务器通过发送由URL指定的内容来对请求做出响应。当然,尽管这是一个非常普通的示例,但是内容检索并不如此受限。

例如,可使用与因特网不同的网络,诸如令牌网、WAP、覆盖式、点对点、专用网等。与HTTP不同的协议可用来请求并传输内容,诸如SMTP、FTP等,且内容可由不同于URL的来指定。本发明的各部分是参照因特网-当今通用的网络的请求因特网-的各种应用来描述的,但应理解对因特网的引用可用对因特网的各个基本概念(例如内联网、虚拟专用网络、封闭的TCP/IP网络等)以及其它形式的网络的变体来代替。还应当理解,本发明可完全在一个计算机或计算机的集合内操作,从而排除对网络的需要。

内容本身可以有许多形式。例如,某些内容可以是文本、图像、视频、动画、程序代码、数据结构、格式化文本等。例如,用户可请求是一页面的内容,该页面具有新闻报道(文本)和附图,并具有到其它内容的链接(诸如通过根据此时使用的超文本标记语言(HTML)来格式化内容)。

HTML是用于从HTTP服务器提供的页面或其它内容的一种通用格式。HTML格式化内容可包括其它HTML内容的链接,且引用其它内容的内容集合可被视为文档web,因此名称“万维网”或“WWW”给出HTML格式化内容集合的一个示例。作为众所周知的结构,它用于许多示例中,但应理解除非另有指明,这些示例所描述的概念并不限于WWW、HTML、HTTP、因特网等等。

在某些实例中,响应于对唯一标识的内容对象的请求而访问内容。例如,寻求获取Yahoo!主页的Yahoo!Spots产品内容的用户可启动web浏览器客户程序,并因此在该web浏览器客户程序提供的对话框中输入URL:sports.yahoo.com。响应于该请求,web浏览器客户程序被编程为向特定服务器做出对指定页面的请求,该特定服务器用所请求的页面响应,所有这些对熟悉诸如HTTP和HTTPS的请求/响应协议的人而言是众所周知的。

在其它实例中,用户可能不记得特定URL,相反以搜索查询的形式发出对内容的更一般请求。在典型的搜索查询中,向用户呈现对话框,在对话框中用户输入搜索查询项并基于那些项开始请求。搜索的一个示例是Yahoo!搜索。执行Yahoo!搜索的一种方法是将web浏览器客户程序导向具有URL:www.yahoo.com的页面,并在该页面提供的搜索对话框中输入搜索查询。响应于web浏览器客户程序发送给www.yahoo.com服务器(或由包含在该页面的HTML中的引用或其它代码所导向的其它服务器)的该查询,接收服务器执行一搜索或使一搜索执行,并通常以一个页面或多个页面的形式将搜索结果返回给web浏览器客户程序。

在目前使用搜索和响应的一个变体中,用户输入一个或多个字符的字符串,通常是以由分隔符(诸如空格或逗号)分开的一个或多个字或概念(标记)的形式,且搜索结果是包含按发现它们的地方而组织的若干搜索命中(hit)的页面。例如,搜索结果页面可列示匹配“Inside Yahoo!”(Yahoo!内部)的命中、匹配Yahoo!目录的命中、匹配赞助的命中、匹配web搜索的命中等。应当理解,“匹配”在不同搜索上下文中有不同的含义。例如,在某些搜索上下文中匹配是确切的,而在其它搜索上下文中匹配是大致的,诸如单数形式和相应的复数形式被视为匹配。

某些搜索在所有可用文档上执行,但其它搜索则可在可用于搜索的文档的一个或多个子域上执行。例如,尽管所有公共的Yahoo!产品都可用于搜索,但是限于Yahoo!Travel(Yahoo!旅行)产品或Yahoo!Spots(Yahoo!体育)产品的搜索是较佳的。常常产生查询的用户会知道要搜索哪个子域,并因此可限制其搜索。然而,这通常需要额外的步骤,诸如导航到与特定子域相关联的页面上并在那儿输入搜索项。

子域搜索的一个方案是提供带有搜索对话框的浏览器或其它软件,该搜索对话框基于搜索项来处理各搜索,这些搜索项映射到指示如何用与子域相关联的各个页面来执行搜索的XML文件。例如,以“dic”开始的搜索字符串可通过XML文件dic.xml来处理,该文件包含有关客户程序应如何模拟用户将剩余的与“dic”目录相关联的参数输入到页面上提供的搜索对话框中的指令。尽管这对结构上未作改变的页面起很好的作用,但是所使用的页面通常并不在客户机的控制下,且XML文件本地存储在客户机上。因此,当例如dic.xml文件所指向的字典网站的维护者改变了该页面的结构时,该搜索会不能正常地操作,而需要每个客户机去重写或更新它们的XML指令,用于访问已改变页面并模拟搜索的用户输入。

所需要的是使用子域和其它技术的改进搜索。

发明内容

根据本发明各实施例的搜索系统分析各搜索查询以确定它们是否被路由到子域,并呈现包括根据子域基础在子域上提供的赞助命中的结果。

由于以下详细描述和较佳实施例,本发明的其它特征和优点将显而易见。

附图说明

图1是根据本发明各实施例的搜索系统的框图。

图2是更详细地示出图1的搜索服务器的元件的框图。

图3是搜索结果页面的示图。

图4是可向用户呈现的用于接受可解析成子域搜索的搜索序列的示图。

图5是可向用户呈现的用于接受可解析成子域搜索的搜索序列的示图,该搜索序列是书签搜索。

图6是搜索服务器的另一变体的框图。

图7示出搜索服务器的其它元件。

图8是用于解析和分析搜索查询并按需调用子域搜索的过程的流程图。

图9是可用于处理所接收和分析的查询的分布式查询处理系统的框图。

图10是对隐含地点的搜索的一个可能处理流的流程图。

附录A是一个线索列表,即可用作用来限制对特定子域的搜索的线索关键字的子域关键字的一个示例。

具体实施方式

本发明的各个实施例将作为示例而非限制进行描述。可以理解,本发明具有广泛效用,并可用于许多不同上下文。

如下所述的搜索过程的示例可由搜索者来建模,该搜索者向搜索系统呈现查询,并接收指示所找到的一个或多个“命中”的响应(搜索结果)。查询可以是搜索查询字符串的形式,该字符串包括由分隔符或解析规则分隔的一个或多个标记。除了基于搜索查询字符串的变体来改变搜索之外,也可将上下文考虑在内。例如,查询者先前可能已对搜索设置了约束,诸如仅返回年龄相当的命中,可考虑先前的搜索,及查询者身份(诸如当前与提交搜索查询字符串的Web浏览器相关联的Yahoo!ID)和用户设定的设置。

当查询由搜索系统接收时,它处理该搜索并返回一个或多个“命中”,其中“命中”是由搜索系统处理的原子单元。例如,当搜索系统管理结构化数据库时,命中是来自结构化数据库的记录。当搜索系统管理文档时,诸如文本文档、图像和文本文档、图像文档、HTML文档、PDF文档等,原子单元是文档。应理解,本发明并不限于任意特定原子文档,但作为示例,本说明书的大部分描述使用文档作为原子单元进行搜索。此外,结构化数据库不是必需的。

命中是搜索系统标识为由查询定义的匹配准则的原子单元。应当理解,搜索系统不需要提供所有命中或仅提供匹配该查询的命中。例如,搜索系统可将返回的命中数量限制为某些数量,可将其它限制应用于查询项,诸如略去匹配该查询的命中,略去重复命中等。该搜索系统还可扩展搜索结果,以包括基本匹配查询的命中,被指定为包括在搜索中的命中,诸如特定标题命中、广告命中等。某些扩展或收缩可取决于这种扩展或收缩之前搜索结果的数量或内容。例如,如果没有命中返回,则搜索引擎添加接近的命中,而如果返回了太多的命中,则可通过诸如在完成搜索结果之前从各查询中删除公用字来移除命中。

搜索者可以是人类用户,诸如将搜索项键入浏览器视窗的人,以通过Web来查询搜索引擎,但是也可以是自动化进程,诸如能够以搜索引擎期望的形式向搜索引擎发送查询的计算机程序。例如,计算机程序可产生查询,并形成发向与搜索引擎耦合的Web服务器的HTTP消息。

在所示的许多示例中,搜索引擎在文档库中搜索匹配通过查询定义的准则的文档(命中)。应理解,术语“文档”通常用于指所搜索的文档库的各个单元。文档可以是诸如合同、文件、小说、著作等的文档,也可以是文本的摘录、在其它上下文中可被视为是文档一部分的数据、程序代码、图像数据、存储文件等。因此,该术语无需进行狭隘地解释。

在搜索中,搜索引擎可取得已索引的所有可用文档,但搜索引擎相反可将搜索限于一个或多个子域内的文档中,其中子域是先前指定的在搜索引擎上可用的所有文档的适当子集。在某些实例中,子域还可进一步划分成更小的子域。

子域的示例是Yahoo!的产品。Yahoo!产品的示例包括Yahoo!新闻、Yahoo!体育、Yahoo!邮件、Yahoo!购物、Yahoo!拍卖、Yahoo!天气等。子域在当发出查询的用户知道特定域外的信息在该实例中不会有用时是有用的搜索工具。例如,用户可对获得纽约的天气信息感兴趣。全球搜索可得到许多顺便提及纽约的天气以及它对某些体育事件的影响的体育报道,但是用户已确定在Yahoo!天气产品外的任何命中都不会有用。作为另一示例,用户可能想要使用将导致已存储电子邮件中只有几个命中而不是在整个Yahoo!产品或Web页面上搜索有数千个命中的关键字,来搜索他或她的已存储的Yahoo!电子邮件。使用子域的一个优点是用户在诸如对话框的一般搜索输入对象中输入搜索,并使搜索服务器分析该搜索查询字符串来确定用户想要的子域。使用子域的另一个优点是,例如可支持免费提供给用户的搜索服务的赞助链接或目标广告,是可在逐个子域基础上分配给赞助商和广告商的赞助链接和广告。

现在参看附图,将描述一个示例性搜索系统。

图1是根据本发明各实施例的搜索系统100的框图。使用搜索系统100,查询者使用搜索客户机向诸如Web浏览器客户机的搜索服务器发出搜索请求。如图1所示,人类用户103或计算机进程105使用搜索客户机110发出查询。通常搜索查询字符串形式的搜索查询被发送给搜索服务器120,该服务器120响应于搜索查询将搜索结果返回给搜索客户机110。在其它变体中,搜索查询来自一个系统,而结果被路由到另一系统。

搜索服务器120被示为与若干子域服务器130耦合,而该子域服务器130又与相应的子域文档库132相耦合。应理解,出于存储效率或其它原因,子域文档库的内容或信息可交迭,使得某些内容或信息在一个以上子域文档库中出现。在本说明书中,其中对象的多个实例和实例数量并不重要,实例可从“1”编号到“N”,并理解为N的值在使用时不必一致,除非另有指示。例如,N被用作子域的数量,而该数量在各个实例中可变化。还应理解,无需使用所有的实例。

各个系统之间的相互连接无需详述,因为相互连接的这些方法可使用众所周知的技术来完成。例如搜索客户机110可以是运行诸如Web浏览器客户程序的HTTP客户程序,并与在搜索服务器120上运行的HTTP服务器通信的个人计算机,它们经诸如请求因特网的网络相互连接。应理解,其它实施例也落入本发明的范围内。例如,搜索客户机110可被实现为手持式装置、无人类用户界面的计算机、专用装置、信息站等。此外,客户机和服务器不必使用HTTP,但可使用不同的协议,用于做出对页面和对象的请求,并对那些请求作响应。

在操作中,并如下详细所述,搜索客户机110将搜索查询字符串传送给搜索服务器120,可能还包括诸如发送请求的Yahoo!用户的Yahoo!ID的上下文数据。使用该上下文,搜索服务器120可查寻所标识用户的用户统计数据,并使用它来通知搜索。搜索服务器120解析并分析搜索查寻字符串,以确定子域搜索是否恰当,然后将该查询发送给适当的(各)子域或执行一般搜索。如图所示,搜索结果可由搜索服务器120返回,但相反它们可由子域服务器直接返回。

图2更详细地示出搜索服务器的元件。如图所示,搜索服务器包括页面构建器200,以及搜索结果210、匹配广告212、匹配插入214、赞助链接216和查询日志220的存储。从一接收查询中,搜索服务器通过执行搜索本身或通过从另一搜索引擎来请求结果而获得搜索结果210。通常,使用对要搜索的文档库的索引,诸如关键字索引,来执行搜索。在该情形中,搜索结果210是基于该索引产生的命中。然后页面构建器200从存储210-216的元件中产生页面,并发送该页面作为搜索查询的响应。

由页面构建器200构建的页面300的一个示例如图3所示。在该示例中,搜索字符串是“camera”(照相机)。页面300包括被组织到不同的页面版面区域302、304、306、308、310、312和314的信息。

页面300的顶部包括搜索的指示,可启动另一搜索的对话框、以及帮助、主页等的可点击链接。简单的搜索结果,诸如来自“camera”的Web索引的搜索结果,在版面区域308中列示。在本示例中,在使用查询字符串“camera”的搜索查询之后,搜索服务器使用Web搜索结果以及可能其它结果来填充存储器210,用与搜索字符串相关联的广告填充存储器212,用与搜索字符串相关联的插入填充存储器214,并用与搜索字符串相关联的赞助链接填充存储器216。

广告可基于所售视图来选择。因而,广告商可支付,以在搜索查询包括字“camera”时在搜索结果页面上示出特定广告。赞助链接也可类似地放置,从而链接的顺序和/或放置可取决于谁为呈现支付以及搜索条件。

版面区域308包括表示响应于搜索项的命中的链接,并最好与谁赞助链接无关。版面区域310被提供用于在某些情形中插入匹配广告或一般广告。版面区域312和314提供对所用搜索项特定的附加匹配插入,但通常不是搜索结果、赞助匹配或广告。在该示例中,版面区域312包含用于执行替代搜索的链接,而版面区域314包含可有选择地执行的子域特定搜索的链接。

然而,在较佳实施例中,子域搜索可在来自搜索查询对话框的定义实例中直接运行。例如,当用户知道他或她在搜索照相机的拍卖时,用户可直接指出,而不用键入“camera”然后选择版面区域314中的链接“Yahoo!Auctions”(Yahoo!拍卖)。这为用户节约了时间和精力,并允许更多的目标插入、广告和赞助链接。例如,用户可指定搜索字符串“auctions camera”(拍卖照相机),且搜索服务器可将第一标记“auctions”解释为子域线索,而不是适当搜索字符串的一部分。在该情形中,搜索服务器将把搜索字符串“camera”导向Yahoo!Auctions专用的子域服务器。

搜索结果页面会更聚焦为一个结果。匹配插入可不包括对搜索项的黄页搜索的链接,且赞助链接和广告可以是选择性的。因而,一个赞助商可选择购买在拍卖子域下而不是一般搜索或黄页子域中的搜索下对项“camera”的赞助链接位置。这样,广告和赞助链接可更为聚焦。这在例如如果广告商想要联系指望通过拍卖买卖照相机的用户,而不是查寻本地照相机店的地点的用户时是有用的。

版面区域30显示匹配插入214。在该示例中,那些匹配插入是与搜索项相关的“Inside Yahoo!”链接。版面区域304显示目录匹配,它们是来自包含Yahoo!目录的子域的匹配,Yahoo!目录则是各主题的分层排列和关联于分层结构中各个层上的那些主题的链接。版面区域306显示赞助匹配,它们是基于特定项的赞助者而提供给用户的命中。

在某些浏览器或其输入装置配置中,向用户提供了工具栏,用于输入搜索、设置首选项、选择/编辑个性化线索集(例如可能是附录A所示的列表的子集),并不经搜索地直接跳到某些服务,诸如主邮箱页面。作为另一示例,对“map sunnyvale94089”可能不需要搜索,而仅需要传送到地图产品、网站或系统中,其中有对Sunnyvale,California的地图的明确请求。

尽管用户可输入诸如“camera”的简单搜索查询,但用户也可输入更为复杂的查询,包括可应用于子域的搜索。例如,输入到图4所示对话框中的搜索“weather94089”可被应用于一个子域。如果执行了例如全部网页上的一般搜索,则搜索将呈现比有用的更多的命中,并且极可能是许多不相关命中。然而,如果所输入的序列被示为是可解析子域搜索,则搜索服务器可通过标识“weather”为天气搜索系统子域的线索来处理该查询,并将请求传递给天气搜索引擎。

在某些实现中,线索不仅仅是与子域相关联的字。例如,搜索服务器可维护一系列有助于确定何时线索将呈现的业务规则。例如,当搜索字符串以5位数开始或结束时,规则可将其解释为具有子域线索,且该子域线索基于邮编限制搜索。因而,对“weather 94089”的搜索可包括两个线索,“weather”标识搜索应在诸如Yahoo!Weather网站的天气子域上进行,且搜索应限于对应于邮编“94089”的区域。

线索可能有许多变体。例如,“94089 pizza”(94089匹萨饼)可被解释成在黄页子域上的搜索,因为它以5位数的线索开始,并且它是对指定邮编中匹萨饼供应商的搜索。在某些实现中,搜索服务器还可维护用户的个性化。使用个性化,所使用的线索可专用于用户。因而,一个用户可设置个性化,使得线索字符串“res”被解释为简历搜索,而另一个用户可设置线索字符串“res”使其解释为餐馆搜索。使用这些存储在搜索服务器上而不是客户机上的个性化,用户可在不同地点上执行个性化的搜索。

在某些情形中,个性化可达这样的程度,在子域上的线索“搜索”仅具有一个命中,从而搜索对话框实际上可用作书签检索。因而,如图5所示,用户可个性化他或她的线索,从而搜索查询字符串“favteam”导致一个返回命中,它是该用户喜欢的运动队的主页。尽管严格说来这并非是搜索,因为代表性地所返回的页面是事先指定的特定URL,但是该同一界面可用来搜索,导致用户对对话框的更加集成的认知。在服务器端,页面产生过程中的某些步骤可能与书签或“导航”搜索相同。例如,插入、广告等的匹配可用搜索多个命中的索引的子域搜索来进行。

图6是示出可与搜索服务器一起使用的若干元件的框图。如图所示,提供了搜索结果和子域特定插入/广告,以及一般插入/广告的存储器。使用个性化搜索的搜索服务器,对“places where weather is not too hot”(天气不太热的地方)的搜索可导致命中、插入和广告的一个结果页面,其中插入和广告由实际执行该搜索的子域服务器确定和/或指定。可提供不专用于搜索或不专用于子域的一般插入和广告当搜索是一导航搜索时,可使用一般插入和广告直到进一步的上下文可由用户用作导航搜索的书签的标记或与该书签标记相关联的URL来确定。

图7是示出可在解析过程中使用的存储器的框图,包括用户首选项的存储器700、业务规则的存储器702以及书签线索的存储器704。存储器700可包括用户指定设置和/或首选项的全部或部分。例如,当用户的设置是用户的Yahoo!首选项时,它可包括用户的年龄、地址、性别、兴趣等。业务规则可包括从字到诸如“天气”、“新闻”、“目录查寻”等子域的映射。业务规则可以是对所有用户相同的集。或者某些用户可具有定制规则。每个用户可具有定制书签,但也可有一般书签集。

当解析器710接收搜索查询字符串和做出查询的用户的指示时,解析器710可使用存储器700、702、704的内容来确定字符串中的哪些标记是线索,并向适当的子域服务器做出适当的搜索请求。接收返回的搜索结果的页面构建器可使用存储器700、702、704来确定要包括在搜索结果页面中的插入和/或广告。因为页面构建器可使用该信息(可容易地由搜索服务器访问),所以插入和广告可以是子域特定的。例如,搜索服务器的操作者可在逐个子域的基础上售卖特定关键字的广告。因而,一个匹萨饼店可购买与搜索项“pizza”一起出现的一个邮编集的所有广告,而在不同地点的另一个匹萨饼店也可购买“pizza”的所有广告,但却是另一个邮编集的所有广告。这使得广告,特别是地点相关的广告提供,更为聚焦。

业务规则703可基于查询日志706的内容来确定。解析器710的操作可受到来自直观推断发生器702的直观推断708的影响,该直观推断发生器702从查询日志706中确定可基于过去的行为应用于查询的各种规则。

图8是搜索服务器可响应于从用户接收的搜索查询字符串执行的解析和影响搜索的过程的一个示例的流程图。在该示例中,要处理为具有至少一个用于子域搜索或其它的线索的搜索前面加诸如“!”的线索操作符。在某些实现中,不需要线索操作符,但在其它实现中它们减少了歧义并允许使用否则认为是线索的东西来执行常规搜索。如图所示,在如果出现线索操作符的情形中,使用作为输入的搜索查询字符串来调用诸如一般Web搜索的一般搜索过程。在某些情形中,初始步骤是解析搜索查询字符串,以确定其哪一部分包括该线索。在其它情形中,线索被认为是隐含的,且搜索服务器确定何时要添加隐含线索。

如果线索操作符出现或隐含,则解析搜索查询字符串。各不相同的业务规则可应用,但在此提供一个示例。如果第一个标记是5位数,则开始时它被解释为邮编,并在有效邮编列表中核对。如果未识别到标记则执行常规搜索,并可能给用户一个消息:尽管使用了线索操作符但未识别到线索。

如果识别到线索,则与不视为线索的项的黑名单作比较。例如,搜索字符串“!94089 Adventures”(!94089探险)可被解释为线索操作符,邮编线索94089和剩下的搜索字符串“adventures”。如果“94089 Adventures”是流行电影的名字,则该搜索查询会经常错误解释。为避免这个,字符串“94089 Adventures”被置于黑名单中,使得该字符串被解释为字符串而非线索。

假设出现了线索操作符,检测到了线索且该线索未出现在黑名单中,则由搜索服务器考虑线索标记。如果线索用于字典子域搜索,则剩下的搜索字符串被传递给字典子域搜索服务器。这可通过将用户的客户机重新导向适当的服务器来进行。类似地,如果线索是用于天气、新闻、地图等子域搜索的,则该请求被导向适当的子域。

在地图、黄页等子域搜索的情形中,附加线索可用来进行地址分辨。例如,搜索查询字符串“!yP 94089parks”(!yp 94089公园)可被解释为线索操作符,“yp”(黄页)线索,用来限制该搜索的附加线索“94089”和剩余字符串“parks”。因而,以上搜索查询字符串将使对公园的黄页子域搜索限于邮编为94089的公园。在邮编(或邮递区号或其它指示符)无效,或者地址无法分辨的情形中,响应可以是一般搜索和错误消息。在某些实例中,诸如不关心地点的黄页搜索,响应可仅仅是错误消息。

在某些浏览器或其它输入设备配置中,向用户提供了工具栏,用于输入搜索、设置首选项、选择/编辑个性化线索集(例如可能是附录A所示的列表的子集),并不经搜索地直接跳到某些服务,诸如对于被认为是对邮箱页面的请求的搜索查询字符串的主邮箱页面。作为另一示例,对“map sunnyvale 94089”可能不需要搜索,而仅需要传送到地图产品、网站或系统中,其中有对Sunnyvale,California的地图的明确请求。

可用作线索关键字的子域关键字的一个实例如附录A所示。这些子域关键字可用来将搜索限制在特定子域中,并还可用来影响这些子域内的搜索。在某些情形中,取决于该子域,搜索系统可将该搜索查询改为指令而不是搜索。例如,搜索系统可将“mail from mom”(来自妈妈的邮件)解释为在邮件子域上对已标识用户的邮件数据库的搜索,搜索来自“发送者=妈妈”的邮件,同时搜索系统可将“!mail”或仅仅“mail”解释为在某些缺省条件下打开用户的邮件界面(诸如用户在邮箱中的页面)的请求。

在某些变体中,用户可对搜索系统如何解释该用户的线索进行个性化。一种方法是向每个用户、类似想法用户的组合提供一个定制快捷键集,或者用户可进行选择的多个定制快捷键集。例如可常见“music enthusiast”(音乐发烧友)的定制快捷键集和“oil driller”(石油钻探工)的定制快捷键集,从而当乐队鼓手选择“music enthusiast”快捷键使用(或作为进一步个性化的基础)时,对“drum store”(鼓店)的搜索导致购买小军鼓等的地点的搜索结果,而石油业的卡车司机可选择“oil driller”定制快捷键,从而对搜索“drum store”(桶店)导向油桶供应商。

在其它搜索系统变体中,搜索系统可基于用户历史和/或概况文件提供对其它搜索或信息的建议。例如,可向鼓手提供未经提示的信息,诸如有关鼓的琐事、其它鼓手发现有用的其它有用搜索等。

在又一变体中,搜索可包括对所搜索文档库的某些部分的隐含限制。因而搜索用户或搜索系统操作者可包括对在用户或操作者控制下的纵向应用的首选项对待。这可以是计划的一部分,来首先发现共同拥有的网站,或限制将更改其内容的第三方的干扰,以尝试在更多搜索中显示。

作为隐含线索操作的一部分,搜索系统可以包括检测隐含的本地搜索的逻辑。例如,对汽车销售商的多数搜索是隐含本地的,因为买车的人通常不在本地区域范围之外购买汽车。

由此,当搜索者输入“福特销售商”时,搜索系统可以增加任何有关用户邮编(或邻近的邮编或地点)的隐含搜索线索。可以用多种方式确定地点,如通过查看用户首选项(如果标识了用户并且具有明确的首选项)、IP/网络地址、移动接入点(来找到移动设备用户所处地的本地信息,而不是他们首选项中的地址)。

对这样的本地化搜索,可给予用户对是否禁用搜索的“本地性”以获得一般搜索,选取另一地点等的选择。在一变体中,向用户返回本地搜索结果和一般搜索结果,其中有区分它们的显示元素(色彩、偏移、标签等)。

当搜索在具有不同语言或方言的区域上进行时,本地信息可用于自动拼写检查或翻译,或以其它方式调整搜索查询。例如,如果输入搜索查询“boot organizer”(靴子/后备箱组织者)且搜索在北美进行时,则它会是无歧义的“鞋库组织者”,而搜索在英国或其它相似语言的英语地区进行时,则搜索会是无歧义的“汽车后备箱存储单元”。

取决于搜索系统操作者的提供,某些搜索查询可被解析以说明用户输入搜索或驱动广告或内容位置的业务规则所采用的路径。例如,如果用户访问运动页面,然后跳到搜索输入页面并输入一搜索,结果可能会受到对用户目前查看运动相关页面的了解的影响。因而,对“competition”(竞争)的搜索可提供与运动竞技相关的页面,而对于该同一搜索字符串,可向来自金融页面的用户提供有关商业竞争的页面。

对于业务规则驱动的结果,搜索系统操作者可向广告商提供选择,以仅向遵从某个路径执行某些搜索的用户显示其广告,从而对“competition”的一个搜索者看到运动培训营的广告以提高在运动场上的竞争力,而对“competition”的另一搜索者则看到对产业分析服务的广告。作为另一示例,从新闻路径搜索“Washington”的人将得到政治广告,而从旅游路搜索“Washington”的人则得到天气页面的提示或链接。其它的业务规则可用于消除歧义。

特别地,显式线索并不限于搜索查询字符串内的特定位置。例如,搜索系统可确定字符串“!weather 94089”、“weather 94089”、“Sunnyvale,CA weather”、“What is the weather in area code 94089”(邮编为94089的区域的天气怎样)等的任一个中的“weather”线索。当然,搜索系统还可确定搜索字符串中的地点线索。确定搜索查询字符串的哪个或哪些标记是线索常常可通过查寻已知意义的字列表来确定,但也可使用查询日志来确定哪些标记是线索。例如,当查询日志中的条目包括所使用的搜索查询字符串以及用户跟随查询选择的搜索结果页面的标识或指示符(标题、URL等)时,可维护查询日志。例如,如果查询日志指示提交搜索“Labrador”(拉布拉多猎狗或拉布拉多区)并获得搜索结果的用户几乎总是选择与狗相关结果页面,而不是与加拿大相关的页面,则搜索系统将不把Labrador用作地点线索。因而,当用户输入对“Labrador food”(拉布拉多猎狗食物)的搜索时,可显现狗食网站。另一方面,如果查询日志所记录的显现大部分对“Labrador”的搜索者点击与加拿大省相关的链接,则搜索系统将把“Labrador food”(拉布拉多食物)中的““Labrador”用作地点线索,从而可导致地点限于加拿大纽芬兰和拉布拉多省的食品店和餐馆的搜索结果。

在查询日志的另一种使用中,线索可通过搜索中时间变化的标记来汇集。如果对特定实体的搜索很快加上了标记,则可添加“新闻”的隐含线索。因而,当用户提交对“Paris fashion”(巴黎时装)的搜索时,搜索系统可返回一般与巴黎时装相关的页面,但如果在查询日志中有对“Paris Fashion”的向上勾号,则搜索系统可使该搜索聚焦于新闻子域,这可能是在许多搜索者查寻有关巴黎时装界的某些突发传闻的信息时用户想要的。

随着所处理的搜索数量的增大,单个搜索服务器可能无法处理这样的负载。为了处理这种情形,搜索服务器可包括多个服务器,各输入查询可被导向其中之一。这些服务器可基于搜索的内容进行选择,但也可不取决于内容而使负载均匀地选择。

图9示出多个搜索客户机可访问搜索系统以将查询应用于文档库的网络化系统。在该系统中,一个或多个(但可能是数千个以上)客户机系统902通过因特网904做出请求。请求通过HTTP服务器906流向服务器908,但应当理解可具有多个HTTP服务器,并可使用补充HTTP或替代HTTP的其它协议。服务器908向查询进程910发送查询,该查询进程可能是服务器908或其它地方的软件对象的实例,或可包括硬件组件。该查询进程910然后解析搜索查询字符串并从一个或多个文档库912获取文档、对文档的引用、链接、或其它命中指示。

在某些实施例中,文档库912是整个文档库的完整副本,但在其它实施例中,文档库912是整个文档库的子集。在后者情形中,服务器908或服务器进程910可从查询或可能其它信息中确定使用哪个文档库。注意,在某些情形中,甚至对单个查询,一个查询进程910也可访问一个以上文档库912。作为示例,独立的子域可被存储为独立文档库。

在图9中,多个对象实例根据括号内标号来区分,诸如客户机系统902的特定实例902(1)。对于各个对象,终端标号是某些诸如“602(N1)”的未指定标号。当对象的标号不需要相同时,终端标号用不同变量来指示。因而,尽管如图9所示确切地有三个服务器980和三个文档库912,但如图9所暗示有N2(不确定数量)个服务器和N6(不确定数量)个文档库912,所以服务器和文档库之间不需要有一一对应关系。除非另有指定,不同的终端标号可具有从1到大于1的范围内的相同或不同值。

在以上示例中,线索可由解析器710来解释。应注意,某些处理可在客户机上进行。或者解释可定制使得最终搜索对不同用户各异。因而,用户首选项可改变搜索,且每个用户可具有他们自己的定制导航线索集。例如,一个用户的首选项可指示他们所居住的城市,并且这可用来通知搜索。例如,如果用户的首选项指示“Sunnyvale,CA”为居住城市,作为搜索查询字符串“!yp pizza”(!yp匹萨饼)可导致在黄页子域上执行对Sunnyvale,CA内或邻近该城市的“pizza”的搜索。除了使用5位邮编、6位邮编等之外,业务规则可包括翻译成地点的城市的列表。其它首选项可包括过滤,诸如滤去不恰当的链接或将搜索限制为用户首选的语言。

对于地点特定的搜索,可期望更聚焦的结果,其中所搜索的子域是根据地点来索引的。在包括城市名的搜索中,线索可被转换成其中子域经过过滤的搜索。例如,当搜索包括“Sunnyvale并用于诸如天气子域的地点索引子域时,搜索可以是对与该地点相关联并匹配剩余搜索字符串的页面。

当搜索被标识为地点特定时,所提供的插入和广告也可以是地点特定的。在以上示例中,在地点特定搜索中对“pizza”的搜索可导致带有来自匹萨饼供应商的广告的结果页面,该供应商选择仅向该地点内使用项“pizza”的搜索者做广告。在某些实例中,主题范围和地点特定的广告活动可得到支持,其中例如广告商可选择购买关联于地点而与使用的子域或搜索项无关的搜索结果页面上的广告。实际上,可仅基于搜索结果(如常规的“关键字”出售)、仅基于地点、或基于两者,对广告或插入活动划分整个搜索结果页面的集合。

图10是对可隐含地点的搜索的一个可能处理流的流程图。如图所示,搜索系统接收一搜索(S1),然后检查搜索查询中可能是地点的东西(S2)。如果未显现指明地点的,则无地点指定地处理该搜索(S3)。然后,在步骤S4,检查地点指示以确定它是否是一例外。例如,假设搜索查询字符串是“Taste of France restaurantmenu”(法国餐馆菜单的风味)。“France”被指定为地点,但进一步假设该搜索系统保留了一个餐馆列表,且其中之一称为“Taste of France”。在该情形中,搜索并非是地点指定为“France”的搜索。然后该搜索系统会无地点指定地处理该搜索(步骤S3),尽管如果知道餐馆的地点可从中采取地点指定。步骤S2和S4的处理(以及可能其它步骤)可使用(各)查询日志的内容来确定哪些标记(如果有的话)是地点线索,提供隐含线索,或确定地点本身。

如果认为地点指定出现,则执行本地搜索(S5),搜索是诸如通过使用剩余的搜索查询字符串的地点过滤器来进行的,其中地点线索被移除。因而搜索“restaurants in Burgundy,France”(法国Burgundy的餐馆)将是使用Burgundy,France的地点过滤器对“restaurants”(或“restaurants in)(餐馆)的搜索。过滤器可操作以限制对根据地点收集的文档库的搜索,或从公共文档库中滤去具有相关联的其它地点的那些命中。

然后,可获取标识地点的地图(S6)以及适当的黄页条目(S7)或黄页条目的提示。然后,结果、地图、黄页等可组合成返回给用户的演示页面(S8)。

某些线索可具有同义字,诸如“dic”、“dictionary”和“define”都映射到字典子域的搜索。某些线索可允许有变化的顺序,诸如“!weather Sunnyvale”和“!weatherSunnyvale”。

某些线索可以是目录特定的,诸如匹配Yahoo!目录结构的项。对于目录特定搜索,搜索可被限于目录的选定目录。例如,搜索查询字符串“!directory lawyersSunnyvale”将被解析成具有表示它是目录搜索的线索、地点特定为Sunnyvale的搜索,以及对律师的搜索,而不是对恰好页面上具有项“lawyer”的律师页面的搜索。这可能是更有用的,因为很多律师的页面上会有他们的名字而没有术语“lawyer”,除非那是企业名称的一部分。

某些线索可以是定制的无歧义线索的形式,其中用户首选项被用来消除在搜索中使用的项的歧义。例如,一个用户可具有表示“football”指“英式足球”的定制消除歧义,而另一个用户可具有表示“football”指“美式足球”的定制消除歧义。

这些定制的消除歧义线索可在中途产生。例如,当用户发送搜索查询,该查询包含标记为多义但尚未消除歧义的项时,用户可得到提示以选择该项的首选含义。在另一方法中,消除歧义并不限于那些标记为多义的项,也可以是用户在所使用的一个或多个项明显多义的搜索结果中作确定时的选项。

对于消除歧义可能会这样,关键字完全消除歧义使得搜索减为单个返回页面。例如,用户可向搜索服务器发送带有搜索查询字符串“football games”(足球比赛)的搜索,并获得有数百页的搜索结果页面。在该搜索结果页面上,如果用户可指定一首选项页面,则该页面可以是响应于使用该项的将来查询而出现的页面。该响应对该用户是特定的,但搜索服务器操作者可选择实现对全部用户或部分用户集合可用的整体歧义消除。

在又一变体中,消除歧义的一种中间方法是消除来自包括许多不同含义的一般响应和与(各)查询项相关联的特定页面的特定响应的一些歧义,且用户的消除歧义可仅减少这些项的译意数量。

在以上许多示例中,所搜索的文档库是一般可访问的文档库。在其它变体中,文档库可以是用户可搜索但搜索服务器通常不作操作的某些数据库。示例是公司雇员查寻,这对用户仅仅是内部可用的,而不是搜索服务器可直接访问的。例如,用户可进入用于大多数搜索的对话框,并键入“!phone Joe Jones”(!Joe Jones的电话)。搜索服务器的解析器将把它解释成对搜索“电话”子域的请求,并用更改后的搜索查寻字符串来将客户机重新引导到客户机可访问但服务器不能访问的数据库。然而,搜索服务器仍然能提供插入和/或广告以保持一致的观感。

在对搜索服务器不直接可用的文档库的更一般方法中,搜索服务器可解析搜索,并将其引荐给可实施该搜索的另一服务器。中介搜索可涉及搜索服务器操作者和中介搜索接受系统的操作者直接的协议,从而某些值为交换中介服务而改变。

本发明已参照较佳实施例进行了描述。对本领域技术人员而言,备选和替换将是显而易见的。因此,这并非旨在限制本发明,但所附权利要求书提供的除外。

附录A

本附录提供了关键字列表的一个示例,该列表在用于后面加“!”(或其它线索指示方法、或隐含线索)的搜索查寻字符串时,将使子域特定搜索进行。

address book             jobs                white pages           yahoo uk

advice                   loans               yahoo argentina       yahoo visa

alerts                   lottery             yahoo asia            yahoo wallet

ask yahoo                mail                yahoo australia       yahooligans

astrology                maps                yahoo baseball        yellow pages

auctions                 members             yahoo basketball

autos                    message boards      yahoo brasil

banking                  messenger           yahoo canada

bill pay                 mobile              yahoo china

bookmarks                money manager       yahoo denmark

briefcase                movies              yahoo directory

buzz index               music               yahoo en espanol

calendar                 mutual fund         yahoo essentials

careers                  my yahoo            yahoo family accounts

chat                     notepad             yahoo football

city guides              pay direct          yahoo france

classifieds              people search       yahoo germany

companion                personals           yahoo golf

dictionary               pets                yahoo help

domains                  photos              yahoo hockey

education                picks               yahoo hong kong

encyclopedia             picture gallery     yahoo horse racing

enterprise solutions     platinum            yahoo india

express                  points              yahoo italy

fantasy auto racing      pool                yahoo japan

fantasy baseball         portal solutions    yahoo korea

fantasy basketball       real estate         yahoo mlb

fantasy football         reference           yahoo nascar

fantasy golf             resumix             yahoo nba

fantasy hockey           shopping            yahoo ncaa

fantasy sports           small business      yahoo nfl

finance                  sports              yahoo nhl

full coverage            stock quotes        yahoo norge

games                    store               yahoo personals

games on demand          taxes               yahoo platinum

geocities                thesaurus           yahoo sbc

get local                tickets             yahoo singapore

greetings                travel              yahoo soaps

groups                   tv                  yahoo soccer

health                   wallet              yahoo sweden

hotjobs                  weather             yahoo taiwan

insurance                weather map         yahoo tennis

job                      web hosting         yahoo tv

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号