首页> 中国专利> 调用第三方搜索引擎搜索结果的搜索方法和搜索系统

调用第三方搜索引擎搜索结果的搜索方法和搜索系统

摘要

本发明揭示了一种调用第三方搜索引擎搜索结果的搜索方法,包括:接收查询指令;对所述查询指令进行需求识别,判断其是否需要调用第三方搜索引擎搜索结果;若是,则根据所述查询指令对缓存数据库中预存数据进行搜索,得到第一搜索结果;若否,则根据所述查询指令在网页存储库中进行搜索,得到第二搜索结果;输出所述第一搜索结果或第二搜索结果;其中,获取所述缓存数据库中预存数据步骤为:从用户历史搜索记录挖掘出用户需求列表;根据所述用户需求列表,调用第三方搜索引擎进行搜索,并得到第三方搜索引擎搜索结果;所述第三方搜索引擎搜索结果存储于所述缓存数据库中。相较于现有技术,本发明提高了用户的检索效率,节约了网络流量。

著录项

  • 公开/公告号CN102135985A

    专利类型发明专利

  • 公开/公告日2011-07-27

    原文格式PDF

  • 申请/专利权人 百度在线网络技术(北京)有限公司;

    申请/专利号CN201110031615.7

  • 发明设计人 甘泉;王婧雅;

    申请日2011-01-28

  • 分类号G06F17/30(20060101);

  • 代理机构深圳市威世博知识产权代理事务所(普通合伙);

  • 代理人何青瓦;李庆波

  • 地址 100085 北京市海淀区上地十街10号百度大厦

  • 入库时间 2023-12-18 02:51:52

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2013-03-06

    授权

    授权

  • 2011-09-07

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20110128

    实质审查的生效

  • 2011-07-27

    公开

    公开

说明书

技术领域

本发明涉及一种调用第三方搜索引擎搜索结果的搜索方法和搜索系统,属于搜索引擎技术领域。

背景技术

现有的搜索引擎调用第三方结果,主要是在双方达成合作关系后的全局性调用。例如,soso曾在2010年以前调用google的检索结果,即soso的检索结果页所显示内容除了soso自己的直达区模块,全部调用google的检索结果。但是,现有的搜索技术都是统一整体调用第三方检索结果,当第三方搜索引擎的响应时间不稳定的情况下,就无法保证搜索结果的及时响应。另外,现有的搜索技术对于需求识别和质量控制做得较差,没有实现精确针对某一类需求,调用第三方检索结果的技术,进而造成用户体验较差,搜索效率较低的问题。

与本发明相关的现有技术可参阅2009年9月23日公开的中国发明专利第CN101539918A号。该专利揭示了一种互联网搜索方法,在服务器端设置效果搜索服务器和源搜索服务器分别与互联网相连,并包括以下步骤:用户输入关键词通过互联网发送到效果服务器;效果搜索服务器以该关键词为索引查询搜索效果数据库,如果搜索效果数据库中有符合条件的搜索效果,则返回给用户,否则启动源搜索服务器;源搜索服务器以该关键词为索引查询源数据库,根据搜索结果生成该关键词对应的搜索效果返回给用户,并将该搜索效果保存在搜索效果数据库中。所述索效果数据库包括缓存,以保证用户搜索结果的实时响应。

但是,与通常的搜索技术一样,因为没有设置需求识别机制,所以在接 到用户的查询指令后,难以对该查询指令进行准确判断,进而导致返回给用户的搜索结果质量较差,进而造成用户体验较差,搜索效率较低的问题。

因此,需要对现有技术中的搜索方法进行改进。

发明内容

本发明目的在于提供一种改进的调用第三方搜索引擎搜索结果的搜索方法,所述方法能够输出准确度较高且搜索质量较好的检索结果。

本发明的另一目的在于提供一种改进的调用第三方搜索引擎搜索结果的搜索系统,所述系统能够输出准确度较高且搜索质量较好的检索结果。

相应地,本发明的一种实施方式的调用第三方搜索引擎搜索结果的搜索方法包括如下步骤:

S21、接收查询指令;

S22、对所述查询指令进行需求识别,判断其是否需要调用第三方搜索引擎搜索结果;

S23、若是,则根据所述查询指令对缓存数据库中预存数据进行搜索,得到第一搜索结果;

S24、若否,则根据所述查询指令在网页存储库中进行搜索,得到第二搜索结果;

S25、输出所述第一搜索结果或第二搜索结果;

其中,获取所述缓存数据库中预存数据步骤为:

S11、从用户历史搜索记录挖掘出用户需求列表;

S12、根据所述用户需求列表,调用第三方搜索引擎进行搜索,并得到第三方搜索引擎搜索结果;

S13、所述第三方搜索引擎搜索结果存储于所述缓存数据库中。

作为本发明的进一步改进,在所述S12和S13步骤间,还包括步骤:

将所述第三方搜索引擎搜索结果进行筛选。

作为本发明的进一步改进,更新所述缓存数据库中预存数据步骤为:

S11’、从用户历史搜索记录和已有预存数据挖掘出用户需求列表;

S12’、根据所述用户需求列表,调用第三方搜索引擎进行搜索,得到搜索结果;

S13’、将所述第三方搜索引擎搜索结果存储于所述缓存数据库中。

作为本发明的进一步改进,在所述S12’和S13’步骤间,还包括步骤:

将所述第三方搜索引擎搜索结果进行筛选。

作为本发明的进一步改进,所述S22步骤,具体为:

判断所述查询指令是否为英文搜索需求。

作为本发明的进一步改进,所述S22步骤,具体为:

分析所述查询指令,对所述查询指令进行过滤;

判断所述查询指令是否为英文搜索需求。

作为本发明的进一步改进,所述过滤包括汉字过滤、网址过滤、软件名过滤、商品过滤及拼音过滤。

相应地,本发明的另一种实施方式的调用第三方搜索引擎搜索结果的搜索方法包括如下步骤:

S21、接收查询指令;

S22、对所述查询指令进行需求识别,判断其是否需要调用第三方搜索引擎搜索结果;

S23、若是,则根据所述查询指令对缓存数据库中预存数据和网页存储库进行搜索,并得到第一搜索结果;

S24、若否,则根据所述查询指令在网页存储库中进行搜索,得到第二搜索结果;

S25、输出所述第一搜索结果或第二搜索结果;

其中,获取所述缓存数据库中预存数据步骤为:

S11、从用户历史搜索记录挖掘出用户需求列表;

S12、根据所述用户需求列表,调用第三方搜索引擎进行搜索,并得到第三方搜索引擎搜索结果;

S13、所述第三方搜索引擎搜索结果存储于所述缓存数据库中。

作为本发明的进一步改进,在所述S12和S13步骤间,还包括步骤:

将所述第三方搜索引擎搜索结果进行筛选。

作为本发明的进一步改进,更新所述缓存数据库中预存数据步骤为:

S11’、从用户历史搜索记录和已有预存数据挖掘出用户需求列表;

S12’、根据所述用户需求列表,调用第三方搜索引擎进行搜索,得到搜索结果;

S13’、将所述第三方搜索引擎搜索结果存储于所述缓存数据库中。

作为本发明的进一步改进,在所述S12’和S13’步骤间,还包括步骤:

将所述第三方搜索引擎搜索结果进行筛选。

作为本发明的进一步改进,所述S22步骤,具体为:

判断所述查询指令是否为英文搜索需求。

作为本发明的进一步改进,所述S22步骤,具体为:

分析所述查询指令,对所述查询指令进行过滤;

判断所述查询指令是否为英文搜索需求。

作为本发明的进一步改进,所述过滤包括汉字过滤、网址过滤、软件名过滤、商品过滤及拼音过滤。

相应地,本发明的一种实施方式的调用第三方搜索引擎搜索结果的搜索系统包括:

UI模块,用于接收查询指令,且所述UI模块还用于接收搜索模块返回的搜索结果,并将所述搜索结果拼装为结果页面后输出;

搜索模块,用于对所述查询指令进行需求识别,判断其是否需要调用第三方搜索引擎搜索结果;以及用于将所述查询指令在所述缓存数据库和/或网页存储库中进行搜索,得到搜索结果;

需求挖掘模块,用于从查询日志中挖掘出用户需求列表;

数据抓取模块,用于根据所述用户需求列表,调用第三方搜索引擎进行搜索,并得到第三方搜索引擎搜索结果;

缓存数据库,用于存储查询指令对应的第三方搜索引擎搜索结果;

网页存储库,用于存储网页数据和该网页数据的索引信息;

查询日志,用于存储用户历史搜索记录。

作为本发明的进一步改进,所述系统还包括:

web服务模块,用于通过网络协议接收客户端发出的查询指令,并将所述查询指令转到所述UI模块,且所述web服务模块还用于接收所述UI模块返回的结果页面,并将所述结果页面返回至所述客户端。

作为本发明的进一步改进,所述系统还包括:

缓存模块,用于提供所述缓存数据库的访问服务接口。

作为本发明的进一步改进,所述缓存模块还用于将所述第三方搜索引擎搜索结果进行筛选。

作为本发明的进一步改进,所述需求挖掘模块还用于从用户历史搜索记录和已有预存数据挖掘出用户需求列表。

作为本发明的进一步改进,所述搜索模块包括:

需求识别单元,用于接收所述UI模块输入的查询指令,并对所述查询指令进行需求识别;以及

搜索单元,用于将经过所述需求识别单元的查询指令在所述缓存数据库和/或网页存储库中进行搜索,得到搜索结果。

作为本发明的进一步改进,所述需求识别单元用于识别所述查询指令是否为英文搜索需求。

作为本发明的进一步改进,所述需求识别单元还用于分析所述查询指令,对所述查询指令进行过滤。

作为本发明的进一步改进,所述过滤包括汉字过滤、网址过滤、软件名过滤、商品过滤及拼音过滤。

相较于现有技术,本发明通过需求识别模块对用户查询指令(query)进行解析,进而能够准确识别哪些用户查询指令需调用第三方搜索引擎搜索结果,提高了检索结果的准确度;另外,通过对存入缓存数据库中的搜索结果进行 筛选,提高了调用第三方搜索引擎搜索结果所返回的搜索结果的质量,总的来说,通过上述方式,本发明提高了用户的检索效率,节约了网络流量。

附图说明

图1是本发明的调用第三方搜索引擎搜索结果的搜索系统的一具体实施方式的工作原理框图;

图2是本发明的调用第三方搜索引擎搜索结果的搜索系统的另一具体实施方式的工作原理框图;

图3是本发明调用第三方搜索引擎搜索结果的搜索方法的流程图。

图4是本发明的调用第三方搜索引擎搜索结果的搜索方法的一实施方式的流程图;

图5是本发明检索流程的一实施方式的具体流程图;

图6是本发明检索流程的另一实施方式的具体流程图;

图7是本发明的调用第三方搜索引擎搜索结果的搜索方法的另一实施方式的流程图。

具体实施方式

以下将结合附图所示的各实施方式对本发明进行详细描述。但这些实施方式并不限制本发明,本领域的普通技术人员根据这些实施方式所轻易做出的结构、方法、或功能上的变换均包含在本发明的保护范围内。

图1所示的本发明的调用第三方搜索引擎搜索结果的搜索系统10与客户端20和第三方搜索引擎30实现互动的工作原理图。本实施方式中,该客户端20包括一浏览器201,客户可通过该浏览器201打开搜索引擎,并在搜索引擎中输入查询指令,一般的,该输入的查询指令为文本信息,当然,该查询指令还可以为图片信息、视频信息等等。所述调用第三方搜索引擎搜索结果的搜索系统10通过网络接收客户输入至所述浏览器201中的查询指令,并对该查询指令进行搜索后,将搜索结果返回至该浏览器201。其中,该调用第三方搜索引擎搜索结果的搜索系统10以及第三方搜索引擎30可以包括一台或多台服务器,该客户端20可以包括一个或多个用户终端设备,如个人计算机、笔记本电脑、无线电话、个人数字处理(PDA)、或其它计算机系统和通信系统。

这些服务器和终端设备在架构上都包含一些基本组件,如总线、处理系统、存储系统、一个或多个输入/输出系统、和通信接口等。总线可以包括一个或多个导线,用来实现服务器或终端设备各组件之间的通信。处理系统包括各类型 的用来执行指令、处理进程或线程的处理器或微处理器。存储系统可以包括存储动态信息的随机访问存储器(RAM)等动态存储器,和存储静态信息的只读存储器(ROM)等静态存储器,以及包括磁或光学记录介质与相应驱动的大容量存储器。输入系统供用户输入信息到服务器或终端设备,如键盘、鼠标、手写笔、声音识别系统、或生物测定系统等。输出系统包括用来输出信息的显示器、打印机、扬声器等。通信接口用来使服务器或终端设备与其它系统或系统进行通信。通信接口之间可通过有线连接、无线连接、或光连接连接到网络中,使调用第三方搜索引擎搜索结果的搜索系统10、客户端20、第三方搜索引擎30间能够通过网络实现相互间的通信。网络可以包括局域网(LAN)、广域网(WAN)、电话网络如公共交换电话网(PSTN)、企业内部的互联网、因特网、或上述这些网络的结合等。

服务器和终端设备上均包含有用来管理系统资源、控制其它程序运行的操作系统软件,以及用来实现特定功能模块的应用软件。如图1所示,在本发明一种实施方式中,所述调用第三方搜索引擎搜索结果的搜索系统主要包括两部分,一部分为搜索部分,另一部分为数据预存部分。其中所述搜索部分包括web服务模块101、与web服务模块101交互通信的UI模块103、与所述UI模块103交互通信的搜索模块105、与所述搜索模块105通信的缓存数据库107,以及与所述搜索模块通信的网页存储库108;所述数据预存部分包括需求挖掘模块111、与所述查询指令挖掘模块111通信的查询日志115,以及与所述需求挖掘模块111通信的数据抓取模块113。其中,所述数据挖掘模块113与所述第三方搜索引擎30交互通信,一般地,所述数据挖掘模块113通过API接口与所述第三方搜索引擎30交互通信。

所述web服务模块101用于通过网络协议接收从所述客户端20传来的查询指令,并将该查询指令转到所述UI模块103,另外,该web服务模块101还用于接收所述UI模块103返回的结果页面,并将所述结果页面返回至所述客户端20。

所述UI模块103用于接收所述web服务模块101传送的查询指令,并将该 查询指令发送至所述搜索模块105进行搜索;另外,所述UI模块103还用于接收所述搜索模块105返回的搜索结果,并将所述搜索结果拼装为结果页面后,返回所述结果页面至所述web服务模块101。

所述搜索模块105用于对所述查询指令进行需求识别,判断其是否需要调用第三方搜索引擎搜索结果;所述搜索模块105还用于接收所述查询指令,并将所述查询指令在所述缓存数据库107和/或网页存储库108中进行搜索,得到搜索结果。

所述缓存数据库107用于存储查询指令对应的第三方搜索引擎搜索结果。通过这样的设置,可使得搜索模块105直接搜索所述缓存数据库107,即可得到搜索结果,而无需从第三方再取一遍。避免了实时检索时,由于第三方搜索引擎响应时间不稳定而造成的延误。因此,本发明的系统在接受用户的查询指令时能够快速反应,用户体验较好,搜索效率较高。所述缓存数据库107中的数据是更新策略的依据,优选地,本发明会记录所述缓存数据库107中每条数据的更新时间、热度(PV值),这样,在做删除或者更新的时候,会根据这些值进行计算,得到合理的更新列表(用户需求列表)和删除列表。

所述网页存储库108用于存储网页数据和该网页数据的索引信息。该数据库即是普通搜索引擎常用的数据库,在此不再赘述。

所述需求挖掘模块111用于从所述缓存数据库107或从所述查询日志115和所述缓存数据库107中挖掘出用户需求列表。优选地,该用户需求列表为从所述查询日志115和所述缓存数据库107中挖掘出需要入库,或者更新的用于需求列表。因对不同的数据有不同的数据更新周期,故所述需求挖掘模块111用于在提高缓存数据库107中第三方搜索引擎搜索结果的时效性与降低所述数据抓取模块113抓取频率之间保持一定的平衡;所述需求挖掘模块111还用于过滤所述查询日志115中的查询指令,以提高检索结果的准确度。举例说明:若所述调用第三方搜索引擎搜索结果的搜索系统是用于在接收到英文搜索需求时,调用第三方搜索引擎搜索结果的,则所述需求挖掘 模块111会分析所述查询指令,并剔除不是英文的查询指令,如:汉字、网址、汉语拼音、软件名、产品型号等非英文查询指令,即是上述的查询指令都不会请求第三方搜索引擎30。

所述数据抓取模块113用于接收所述用户需求列表并根据所述用户需求列表调用所述第三方搜索引擎30,并抓取所述第三方搜索引擎30的第三方搜索引擎搜索结果;所述数据抓取模块113还用于将抓取到的搜索结果存入所述缓存数据库107中。所述数据抓取模块113设有自己的并发请求策略,保证按照要求的QPS(query per second)上限进行抓取,不会超过所述上限。所述缓存数据库107中的数据有时效性要求,超过一定时间就可能过期,更新就是为了保证所述缓存数据库107中数据的时效性。

所述查询日志115用于存储用户历史搜索记录。优选地,其可包括查询指令、查询次数,以及加权点击数等信息。所述查询日志115定期或者不定期的更新,因而存入缓存数据库107中的第三方搜索引擎搜索结果也在不断地更新。

如图2所示,在本发明另一种实施方式中,所述调用第三方搜索引擎搜索结果的搜索系统主要包括两部分,一部分为搜索部分,另一部分为数据预存部分。其中所述搜索部分包括web服务模块101、与web服务模块101交互通信的UI模块103、与所述UI模块103交互通信的搜索模块105、与所述搜索模块105通信的网页存储库108、与所述搜索模块105交互通信的缓存模块106、与所述缓存模块106通信的缓存数据库107;所述数据预存部分包括需求挖掘模块111、与所述查询指令挖掘模块111通信的查询日志115,以及与所述需求挖掘模块111通信的数据抓取模块113。其中,所述数据挖掘模块113与所述第三方搜索引擎30交互通信,一般地,所述数据挖掘模块113通过API接口与所述第三方搜索引擎30交互通信。

所述web服务模块101用于通过网络协议接收从所述客户端20传来的查询指令,并将该查询指令转到所述UI模块103,另外,该web服务模块101还用于接收所述UI模块103返回的结果页面,并将所述结果页面返回至所述客户端 20。

所述UI模块103用于接收所述web服务模块101传送的查询指令,并将该查询指令发送至所述搜索模块105进行搜索;另外,所述UI模块103还用于接收所述搜索模块105返回的搜索结果,并将所述搜索结果拼装为结果页面后,返回所述结果页面至所述web服务模块101。

所述搜索模块105用于对所述查询指令进行需求识别,判断其是否需要调用第三方搜索引擎搜索结果;所述搜索模块105还用于接收所述查询指令,以及在所述网页存储库108中进行搜索,所述搜索模块105还用于通过所述缓存模块106将所述查询指令在所述缓存数据库107中进行搜索,以及得到搜索结果。

所述缓存模块106用于提供所述缓存数据库107的访问服务接口。优选地,在本发明中,所述缓存模块106用于接收所述搜索模块105的搜索要求,在所述缓存数据库107中进行搜索;以及用于接收所述数据抓取模块113中抓取到的所述第三方搜索引擎30的搜索结果,并将其存入所述缓存数据库107中;所述缓存模块106还用于依据一定的过滤条件对所述第三方搜索引擎30的搜索结果进行筛选,其中只有符合要求的第三方搜索引擎30的搜索结果才会被最终存入所述缓存数据库107中。例如,乱码的搜索结果预先被剔除。如此设置,可以提高调用第三方搜索引擎搜索结果所返回的搜索结果的质量。

所述缓存数据库107用于存储查询指令对应的第三方搜索引擎搜索结果。通过这样的设置,可使得搜索模块105直接搜索所述缓存数据库107,即可得到搜索结果,而无需从第三方再取一遍。避免了实时检索时,由于第三方搜索引擎响应时间不稳定而造成的延误。因此,本发明的系统在接受用户的查询指令时能够快速反应,用户体验较好,搜索效率较高。所述缓存数据库107中的数据是更新策略的依据,优选地,本发明会记录所述缓存数据库107中每条数据的更新时间、热度(PV值),这样,在做删除或者更新的时候,会根据这些值进行计算,得到合理的更新列表(用户需求列表)和 删除列表。

所述网页存储库108用于存储网页数据和该网页数据的索引信息。

所述需求挖掘模块111用于从所述查询日志115和所述缓存数据库107中挖掘出用户需求列表。优选地,该用户需求列表为从所述查询日志115和所述缓存数据库107中挖掘出需要入库,或者更新的用于需求列表。因对不同的数据有不同的数据更新周期,故所述需求挖掘模块111用于在提高缓存数据库107中第三方搜索引擎搜索结果的时效性与降低所述数据抓取模块113抓取频率之间保持一定的平衡;所述需求挖掘模块111还用于过滤所述查询日志115中的查询指令,以提高检索结果的准确度。举例说明:若所述调用第三方搜索引擎搜索结果的搜索系统是用于在接收到英文搜索需求时,调用第三方搜索引擎搜索结果的,则所述需求挖掘模块111会分析所述查询指令,并剔除不是英文的查询指令,如:汉字、网址、汉语拼音、软件名、产品型号等非英文查询指令,即是上述的查询指令都不会请求第三方搜索引擎30。

所述数据抓取模块113用于接收所述用户需求列表并根据所述用户需求列表调用所述第三方搜索引擎30,并抓取所述第三方搜索引擎30的第三方搜索引擎搜索结果;所述数据抓取模块113还用于将抓取到的搜索结果存入所述缓存数据库107中。所述数据抓取模块113设有自己的并发请求策略,保证按照要求的QPS(query per second)上限进行抓取,不会超过所述上限。所述缓存数据库107中的数据有时效性要求,超过一定时间就可能过期,更新就是为了保证所述缓存数据库107中数据的时效性。

所述查询日志115用于存储用户历史搜索记录。优选地,其可包括查询指令、查询次数,以及加权点击数等信息。所述查询日志115定期或者不定期的更新,因而存入缓存数据库107中的第三方搜索引擎搜索结果也在不断地更新。

如图3所示,优选地,在上述各个实施方式中,所述搜索模块105包括了搜索单元1051,和需求识别单元1052。

所述搜索单元1051用于将经过所述需求识别单元1052的查询指令在所述缓存数据库107和/或网页存储库中进行搜索,得到搜索结果。

所述需求识别单元1052用于接收所述UI模块103输入的查询指令,并对所述查询指令进行需求识别,以提高检索结果的准确度。举例说明:若所述调用第三方搜索引擎搜索结果的搜索系统是用于在接收到英文搜索需求时,调用第三方搜索引擎搜索结果的,则所述需求识别单元1052会分析所述查询指令,并剔除不是英文的查询指令,如:汉语拼音、软件名、产品型号等非英文查询指令。

在本发明调用第三方搜索引擎搜索结果的搜索方法的一实施方式中,其包括数据预充流程及检索流程,其中,如图4所示,数据预充流程包括如下步骤:

S11,从查询日志115中的用户历史搜索记录挖掘出用户需求列表;优选地,该步骤是通过需求挖掘模块111和所述查询日志115完成;

S12,根据所述用户需求列表,调用第三方搜索引擎进行搜索,并得到第三方搜索引擎搜索结果;优选地,该步骤是通过所述数据抓取模块113调用所述第三方搜索引擎30进行搜索,并得到所述第三方搜索引擎30输出的搜索结果;

S14,将所述第三方搜索引擎搜索结果存储于所述缓存数据库中。

预选地,在本发明最佳实施方式中,在所述S12和所述S14步骤之间,还包括S13,将所述第三方搜索引擎搜索结果进行筛选;优选地,该步骤是通过所述缓存模块106完成的,所述缓存模块106依据一定的过滤条件对所述第三方搜索引擎30的搜索结果进行筛选,其中只有符合要求的第三方搜索引擎30的搜索结果才会被最终存入所述缓存数据库107中。例如,乱码的搜索结果预先被剔除。如此设置,可以提高调用第三方搜索引擎搜索结果所返回的搜索结果的质量。

如图5所示,所述检索流程S2包括如下步骤:

S21,接收查询指令;优选地,该查询指令是用户通过客户端上的浏览 器输入的至web服务模块101,该web服务模块101在得到所述查询命令后,会将该查询命令转到UI模块103;

S22,对所述查询指令进行需求识别,判断其是否需要调用第三方搜索引擎搜索结果;优选地,该步骤是通过搜索模块105中的需求识别单元1052完成的;优选地,在本发明最佳实施方式中,所述需求识别为识别所述查询指令是否为一英文搜索需求;所述需求识别单元1052会分析所述查询指令,并剔除不是英文的查询指令,如:汉字、网址、汉语拼音、软件名、产品型号等;

S23,若是,则根据所述查询指令对缓存数据库中预存数据进行搜索,并得到第一搜索结果;优选地,该步骤是通过所述搜索模块105中的搜索单元1051完成的;

S24,若否,则根据所述查询指令在网页存储库中进行搜索,得到第二搜索结果;

S25,输出所述第一搜索结果或第二搜索结果。优选地,该步骤是在所述UI模块103和所述web服务模块101中完成的,搜索结果从所述搜索模块105返回至所述UI模块103,并通过所述UI模块103将所述搜索结果拼装为结果页面后,返回所述结果页面至所述web服务模块101,从而通过所述web服务模块101返回至客户端浏览器。

在本发明的另一实施方式中,如图6所示,所述检索流程包括如下步骤:

S21’,接收查询指令;优选地,该查询指令是用户通过客户端上的浏览器输入的至web服务模块101,该web服务模块101在得到所述查询命令后,会将该查询命令转到UI模块103;

S22’,对所述查询指令进行需求识别,判断其是否需要调用第三方搜索引擎搜索结果;优选地,该步骤是通过搜索模块105中的需求识别单元1052完成的;优选地,在本发明最佳实施方式中,所述需求识别为识别所述查询指令是否为一英文搜索需求;所述需求识别单元1052会分析所述查询指令,并剔除不是英文的查询指令,如:汉字、网址、汉语拼音、软件名、产品型 号等;

S23’,若是,则根据所述查询指令对缓存数据库中预存数据和网页存储库进行搜索,并得到第一搜索结果;优选地,该步骤是通过所述搜索模块105中的搜索单元1051完成的;

S24’,若否,则根据所述查询指令在网页存储库中进行搜索,得到第二搜索结果;

S25’,输出所述第一搜索结果或第二搜索结果。优选地,该步骤是在所述UI模块103和所述web服务模块101中完成的,搜索结果从所述搜索模块105返回至所述UI模块103,并通过所述UI模块103将所述搜索结果拼装为结果页面后,返回所述结果页面至所述web服务模块101,从而通过所述web服务模块101返回至客户端浏览器。

如图7所示,在本发明调用第三方搜索引擎搜索结果的搜索方法的一实施方式中,可更新所述缓存数据库107,其包括如下步骤:

S11’,从查询日志115和缓存数据库107中的用户历史搜索记录和已有预存数据挖掘出用户需求列表;优选地,该步骤是通过需求挖掘模块111和所述查询日志115完成;

S12’,根据所述用户需求列表,调用第三方搜索引擎进行搜索,并得到搜索结果;优选地,该步骤是通过所述数据抓取模块113调用所述第三方搜索引擎30进行搜索,并得到所述第三方搜索引擎30输出的搜索结果;

S14’,将所述第三方搜索引擎搜索结果存储于所述缓存数据库中。

预选地,在本发明最佳实施方式中,在所述S12’和所述S14’步骤之间,还包括S13’,将所述第三方搜索引擎搜索结果进行筛选;优选地,该步骤是通过所述缓存模块106完成的,所述缓存模块106依据一定的过滤条件对所述第三方搜索引擎30的搜索结果进行筛选,其中只有符合要求的第三方搜索引擎30的搜索结果才会被最终存入所述缓存数据库107中。例如,乱码的搜索结果预先被剔除。如此设置,可以提高调用第三方搜索引擎搜索结果所返回的搜索结果的质量。

通过上述描述可知,本发明通过需求识别模块对用户查询指令(query)进行解析,进而能够准确识别哪些用户查询指令需调用第三方搜索引擎搜索结果,提高了检索结果的准确度;另外,通过对存入缓存数据库中的搜索结果进行筛选,提高了调用第三方搜索引擎搜索结果所返回的搜索结果的质量,总的来说,通过上述方式,本发明提高了用户的检索效率,节约了网络流量。

应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号