法律状态公告日
法律状态信息
法律状态
2018-11-13
授权
授权
2014-08-20
实质审查的生效 IPC(主分类):G06F17/30 申请日:20100531
实质审查的生效
2014-07-23
公开
公开
本申请是申请日为2010年5月31日的发明创造名称为“一 种搜索与应用相结合的方法和设备”的中国专利申请(国家申请号为 No.201010187100.1)的分案申请。
技术领域
本发明涉及计算机技术领域,尤其涉及用于将搜索与应用相结合 的方法、设备以及应用接口。
背景技术
自从70、80年代互联网普及以来,为满足用户在互联网上访问 海量信息的要求,出现了许多网络搜索技术,我们简单回顾如下:
90年代早期出现基于人工信息分类的EINet Galaxy搜索引擎。随 后与19994年Lycos搜索引擎推出,其包括基于机器人程序(Robot) 的数据挖掘技术和支持搜索结果相关性排序。
1995年的AltaVista推出的搜索引擎第一个支持自然语言搜索的 搜索引擎,具备了基于网页内容分析,智能处理的能力,第一个实现 高级搜索语法的搜索引擎(如AND、OR、NOT等)。
1997年,Northernlight公司推出的搜索引擎第一个支持对搜索结 果进行简单的自动分类,也是当时拥有最大数据库的搜索引擎之一。
1998年,Google推出基于其PAGERANK算法的搜索引擎,其根 据网页之间相互的超链接计算的网页排序。
2000年,百度创始人李彦宏推出基于超链分析的百度搜索引擎。
现有的搜索引擎的基本工作原理如下:
1)自动搜集信息:搜索引擎的信息搜集基本都是自动的。搜索 引擎利用称为网络蜘蛛(spider)的自动搜索机器人程序来连上每一 个网页上的超链接。机器人程序根据网页链到其中的超链接,就象日 常生活中所说的“一传十,十传百......”一样,从少数几个网页开始, 连到数据库上所有到其他网页的链接。理论上,若网页上有适当的超 链接,机器人便可以遍历绝大部分网页。
2)建立索引库:搜索引擎整理信息的过程称为“建立索引”。搜 索引擎不仅要保存搜集起来的信息,还要将它们按照一定的规则进行 编排并保存于索引库中。这样,搜索引擎可以根据查询信息在索引库 中迅速找到所要的资料。
3)接受查询:用户向搜索引擎发出查询,搜索引擎接受查询并 向用户返回资料。搜索引擎每时每刻都要接到来自大量用户的几乎是 同时发出的查询,它按照每个用户的要求检查自己的索引,在极短时 间内找到用户需要的资料,并将搜索结果返回给用户,其中搜索结果 一般包括网页链接及摘要描述。在有多个搜索结果的情形下,需要利 用各种算法进行排序,其中,最著名的搜索排序算法为Google的 PageRank算法(参见美国专利US6285999),其原理是根据网页之间 相互的超链接计算进行网页排序,搜索引擎把从A网页到B网页的 链接解释为A网页给B网页投票,并根据投票来源(甚至来源的来 源,即链接到A网页的网页)和投票目标的等级来决定新的等级。简 单的说,一个高等级的网页可以使被其链接或引用的其他低等级网页 的等级提升。
其中,整理信息及接受查询的过程,大量应用了文本信息检索技 术,并根据网络超文本的特点,引入了更多的信息。
对于文本信息检索,早期的信息检索系统采用“布尔查询”的方法 来进行全文检索。用户必须详细的规划自己的查询,其复杂程度不亚 于编程语言。这种检索方式并不提供任何的文档相关性测度,对于文 档与查询的评价就只有“匹配”,“不匹配”两种而已。这两点问题决定 了布尔查询不能被广泛应用。
对于大规模的语料库,任何检索都可能返回数量众多的结果,因 此对检索结果进行排序是必须的。因此,一个好的信息检索模型必须 提供文档相关性测度。一个好的测度应该使与用户查询需求最相关的 那些结果,排在最前面,同时允许尽可能多的,与用户查询有一定关 系的结果被包括进来。目前,最为常用的信息检索模型有三种:
I向量空间模型(Vector Space Model,VSM)
II概率模型(Probabilistic Model)
III推理网络模型(Inference Network Model)
常规的搜索引擎在接收到用户输入的查询请求时,会返回相关的 链接列表以及该链接指向的网页的简短摘要,这些链接直接指向相关 的网址或网页。用户通过浏览这些链接的摘要,筛选出可能相关的网 页,然后点击链接进入该网页进行浏览。通常可能需要点击进入多个 网页才能够找到所需的内容。当点击链接进入一个网页时,浏览器会 下载该链接对应的整个网页,包括图片、文字、Flash、广告等等,其 中大部分内容是与用户的需求无关的。下载过程需要等待时间并且占 用网络带宽,下载的页面会占据内存和硬盘空间。即便浏览完毕后关 闭该页面,内存也可能不被释放。因此通常打开20多个网页后,内 存容量被耗尽,进而采用硬盘的空间作为虚拟内存,大大地降低计算 机的运行速度。并且缓存在硬盘中的网页日积月累,会产生大量存储 碎片,需要定期清理。如此反复地打开关闭网页的过程,费时费力, 效率较低。
发明内容
为了提高搜索引擎的效率,减少用户打开新的网页的次数,降低网 络流量,减少对内存和硬盘空间的占用。本发明的目的是提供一种搜索 与应用相结合的方法,该方法包括以下步骤:获取该用户的查询请求; 根据所述查询请求进行匹配搜索,以获得包含与所述查询请求相匹配的 应用接口的搜索选项;以及将所述包含应用接口的搜索选项提供给所述 用户。
根据本发明的另一个方面,还提供了一种搜索与应用相结合的设备, 该设备包括:获取装置,用于获取该用户的查询请求;查询装置,用于 根据所述查询请求进行匹配搜索,以获得包含与所述查询请求相匹配的 应用接口的搜索选项;提供装置,用于将所述包含应用接口的搜索选项 提供给所述用户。
与现有技术相比,本发明允许用户通过在搜索引擎中输入关键字, 直接向用户呈现相关的应用接口,用户对应用接口的直接操作即可获得 相关的信息而不需要打开新的网页,等待下载网页内容这些操作步骤。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述, 本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本发明的方法向用户提供应用接口的流程图;
图2示出根据本发明的方法用户操作应用接口的流程图;
图3示出根据本发明的方法由搜索引擎自动收集网页的应用接口 的流程图;
图4示出根据本发明的方法由用户提交网页的应用接口的流程 图;
图5示出根据本发明的设备的一个实施例的方框图;
图6示出根据本发明的设备的另一个实施例的方框图;
图7A示出在搜索引擎上呈现的应用接口的示意图;以及
图7B示出在包含对应应用接口的网页上呈现的应用接口的示意 图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
与常规的搜索引擎使用方式相类似,用户在搜索特定内容时,需 要在搜索框中输入相关的关键词,然后搜索引擎服务器将从索引库中 查找与该关键词对应的链接及其相关内容呈现给用户。本发明与现有 搜索引擎不同之处在于,搜索引擎不只是向用户呈现仅仅能够点击跳 转的链接,而是还根据用户的需求以及对大量用户行为的统计分析, 提供相关网页上的应用接口。这些应用接口包括但不限于:图表、输 入框、控件、选项列表、下载链接、运算接口和/或对话框等等。用 户不需要离开搜索引擎的页面就可以直接对这些应用接口进行操作, 以获得进一步的信息。根据接口的类型不同,这些操作包括但不限于: 登录、选择、计算、查询、下载、游戏操作、即时通讯和或音视频通信 等等。这些应用接口来源于目标网页,但不一定与目标网页上的接口 表现形式相同。
图7A示出在搜索引擎上呈现的应用接口的示意图;图7B示出 在包含对应应用接口的网页上呈现的应用接口的示意图。
如图7A中所示,当用户在搜索框701中输入“新浪邮箱”时, 搜索引擎将把“新浪邮箱”的链接702和其登录框703呈现给用户。 用户不需要打开新浪邮箱702的链接就可以直接在搜索引擎的页面上 的登录框703中输入用户名和密码,然后直接登录新浪邮箱。这里的 登录框703是本发明中所述的一种应用接口。该搜索引擎中的应用接 口与相关网页“新浪邮箱”702的应用接口相对应。如图7B中所示, 当打开“新浪邮箱”702的链接时可以看到在“新浪邮箱”网页上有 两个登录框“新浪免费邮箱”登录框704和“新浪VIP邮箱”登录框 705。在搜索引擎页面上呈现的登录框703与“新浪邮箱”页面上的 “新浪免费邮箱”登录框704相对应。当用户在登录框703中输入用 户名和密码并登录时,搜索引擎的应用接口将把用户输入的用户名和 密码传递到“新浪邮箱”页面上的“新浪免费邮箱”登录框704相应 框中,实现邮箱的登录。因此,本发明的将搜索与应用接口相结合, 减少了用户的操作步骤,减少页面打开的次数。
下面参照图1描述本发明的方法的实现步骤。
图1示出根据本发明的方法向用户提供应用接口的流程图。
如图1中所示,首先在步骤S101,获取用户的查询请求。该查 询请求可以是用户输入的单个关键词、关键词的组合、句子等。在步 骤S102中,搜索引擎从用户输入的查询请求中提取的关键词,然后 再索引库中进行匹配搜索,获得与该查询请求相匹配的应用接口的搜 索选项;接着在步骤S103中,将包含应用接口的搜索选项提供给用 户。所述搜索选项中除了应用接口之外一般还包括该应用接口对应的 网页的链接以及相关描述内容。该步骤执行完成后可以转到图2中所 示的用户操作阶段。
图2示出根据本发明的方法用户操作应用接口的流程图。
如图2中所示,在步骤S201中,用户可以直接对搜索引擎提供 的应用接口进行操作(S201),根据所呈现的应用接口不同,用户对 应用接口的操作方式也不同。例如,如果应用接口是一个下载链接, 则用户可以在应用接口中直接下载相关程序和文件;如果应用接口是 一个登录框,用户可以直接在该应用接口上完成登录操作;如果应用 接口是一个搜索框,用户可以在该应用接口上执行进一步的搜索操 作;如果应用接口是一个客服界面,则用户在该应用接口中提出问题, 并及时得到回应,如此等等。根据对应用接口执行操作后是否需要跳 转到其他网页,可以把应用接口的类型分为返回型和跳转型(S203)。 对于返回型应用接口来说,用户不需要跳转到新的页面,用户对应用 接口的操作搜索引擎被反馈到提供该应用接口或该应用接口对应的 网站,网站根据用户对应用接口的操作返回相应信息给搜索引擎,搜 索引擎接着将返回的信息呈现给用户(S204)。从用户端来看,不需 要打开新的网页即可获得相关的信息。对于跳转型应用接口来说,搜 索引擎把用户对应用接口进行的操作发送到相关网页,并且同时跳转 到该网页操作的结果页面(S205),这时在用户端需要打开新的结果 页面,但是省略了登录初始页面的操作。
图3示出根据本发明的方法由搜索引擎自动收集网页的应用接口 的流程图。
如图3中所示,搜索引擎可以定期分析大量网页上是否存在应用 接口(S301),以及用户对这些应用接口的操作频率,对包含该应用 接口的网页的点击频率,对包含该应用接口的网站的点击频率是否超 过预定阈值来判断是否满足提取条件(S302)。如果判断满足提取条 件,则提取应用接口和特定关键词,并且置于索引库中(S303)。接 着,将所提取的应用接口与特定关键词相关联(S304)。如果不满足 提取条件,则转到步骤S301,继续分析下一个网页。
除了系统自动搜索和提取应用接口之外,用户也可以主动地向搜 索引擎提交应用接口。
图4示出根据本发明的方法由用户提交网页的应用接口的流程 图。
在步骤S401,用户向搜索引擎提交特定网页上的应用接口。搜 索引擎可以审核所提交的应用接口是否符合要求。如果符合要求,则 在步骤S402将应用接口和该网页上获得的特定关键词或者用户提供 的关键词置于索引库中;并且在步骤S403,将所提取的应用接口与 特定关键词相关联。
为了实现本发明的方法,在此提供一种将搜索与应用相结合的设 备。图5示出根据本发明的设备的一个实施例的方框图。
如图5中所示,搜索引擎服务器50包括提取装置501、收集装置 502、关联装置503、索引库504、提交装置505、查询装置506、获 取装置507和提供装置508。
上述装置分别实现本发明的从网页收集应用接口并提供给用户 的方法。
图6示出根据本发明的设备的另一个实施例的方框图。
图6中所示的搜索引擎服务器50还包括反馈装置509、跳转装置 510、更新装置511、应用接口操作装置512和呈现装置513。上述装 置相互配合用于实现用户对搜索引擎呈现的应用接口的操作过程。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明 并不局限于上述特定实施方式,本领域技术人员可以在所附权利要求 的范围内做出各种变形或修改。
机译: 将广度优先和深度优先搜索策略与应用于大编码大小的图形搜索问题的应用相结合的系统和方法
机译: 将广度优先和深度优先搜索策略与应用于大编码大小的图形搜索问题的应用相结合的系统和方法
机译: 在计算机中实现的使用应用程序接口,计算机程序产品,系统应用程序接口,设备eletr u00c8nico将应用程序附加到映射模块的方法以及在计算机中实现的将u M事件关联到一个或多个应用程序的方法。