首页> 中国专利> 基于自然搜索结果提供精确观点的搜索方法及装置

基于自然搜索结果提供精确观点的搜索方法及装置

摘要

本发明提供了一种基于自然搜索结果提供精确观点的搜索方法及装置。所述方法包括:当接收到对知识类问题的搜索请求时,从问答数据库中查询与所述知识类问题类型相同的至少一个目标问答网页;获取与所述目标问答网页相对应的目标答案,其中,所述目标答案是预先对所述问答数据库中资源进行挖掘得到的针对所述知识类问题的精确观点;由所述至少一个目标问答网页集成针对所述知识类问题的搜索结果,并将所述目标答案添加至所述搜索结果的预设位置。该技术方案能够大幅度缩短用户搜索知识类问题时的判断和分析过程,进而很好地满足了针对知识类问题的问答需求。

著录项

  • 公开/公告号CN106168962A

    专利类型发明专利

  • 公开/公告日2016-11-30

    原文格式PDF

  • 申请/专利号CN201610509367.5

  • 发明设计人 姚远;

    申请日2016-06-30

  • 分类号G06F17/30;G06N5/02;

  • 代理机构北京智汇东方知识产权代理事务所(普通合伙);

  • 代理人康正德

  • 地址 100088 北京市西城区新街口外大街28号D座112室(德胜园区)

  • 入库时间 2023-06-19 00:57:41

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-02-21

    授权

    授权

  • 2016-12-28

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20160630

    实质审查的生效

  • 2016-11-30

    公开

    公开

说明书

技术领域

本发明涉及互联网技术领域,特别是涉及一种基于自然搜索结果提供精确观点的搜索方法及装置。

背景技术

问答需求是网络上用户使用比例非常高的需求,其中一类问答需求具有明确问答查询及答案唯一的特征,例如:用户针对“XXX能不能或可不可以怎么样”、“XX可以做什么吗”、“XX是什么吗”等问题寻找特定答案。

目前,针对这类问答需求是通过大量用户的点击排序为用户推荐一些链接中可能存在用户所需答案的内容的,例如,自然搜索结果中包括来自不同站点的各个链接,这些链接中可能存在用户所需答案的内容,搜索引擎将这些可能存在用户所需答案的内容展现出来。但是,这种推荐方法并没有直接给出用户针对问题的明确答案,用户仍需从各个链接中寻找自己所需的内容,进而阅读该内容以分析出明确答案。可见,这种搜索方法无法为用户提供明确的答案,需要用户花费时间和精力去分析文本以得到答案,对用户而言成本非常高。

发明内容

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种基于自然搜索结果提供精确观点的搜索方法及装置。

依据本发明的一个方面,提供了一种基于自然搜索结果提供精确观点的搜索方法,包括:

当接收到对知识类问题的搜索请求时,从问答数据库中查询与所述知识类问题类型相同的至少一个目标问答网页;

获取与所述目标问答网页相对应的目标答案,其中,所述目标答案是预先对所述问答数据库中资源进行挖掘得到的针对所述知识类问题的精确观点;

由所述至少一个目标问答网页集成针对所述知识类问题的搜索结果,并将所述目标答案添加至所述搜索结果的预设位置。

可选地,所述至少一个目标问答网页对应唯一的目标答案;

所述将所述目标答案添加至所述搜索结果的预设位置,包括:

从所述至少一个目标问答网页中选择一个目标问答网页作为最佳目标问答网页;

将所述目标答案添加至所述最佳目标问答网页对应的预设位置。

可选地,从所述至少一个目标问答网页中选择一个目标问答网页作为最佳目标问答网页,包括:

按照预设参数对所述至少一个目标问答网页进行排序,所述预设参数包括对各目标问答网页的访问率和/或各目标问答网页中包含的问题与所述知识类问题的相关度;

将排序最前的目标问答网页确定为所述最佳目标问答网页。

可选地,各目标问答网页对应各自的目标答案;

所述将所述目标答案添加至所述搜索结果的预设位置,包括:

将所述目标答案添加至各自对应的目标问答网页所对应的预设位置。

可选地,将所述目标答案添加至所述搜索结果的预设位置,包括:

将所述目标答案以预设形式添加至所述搜索结果的预设位置,所述预设形式包括图标形式和/或文本形式。

可选地,所述方法还包括:

从所述问答数据库中获取类型相同的问答网页;

获取所述类型相同的问答网页各自包含的知识类观点;

从所述知识类观点中提取精确观点作为所述类型相同的问答网页对应的目标答案。

可选地,从所述问答数据库中获取类型相同的问答网页,包括:

根据所述问答数据库中每个问答网页的预设文本,确定所述每个问答网页的类型,所述预设文本包括标题、摘要、关键字中的至少一项;

根据所述每个问答网页的类型,获取所述类型相同的问答网页。

可选地,从所述知识类观点中提取精确观点作为所述类型相同的问答网页对应的目标答案,包括:

计算每个知识类观点的出现率;

将所述出现率最高的知识类观点确定为所述精确观点,作为所述类型相同的问答网页对应的目标答案。

可选地,所述方法还包括:

将所述类型相同的问答网页与其对应的目标答案存储在预设分布式存储数据库中;

相应地,所述获取与所述目标问答网页相对应的目标答案,包括:

从所述预设分布式存储数据库中获取与所述目标问答网页相对应的目标答案。

可选地,所述预设分布式存储数据库为HBase数据库。

可选地,所述方法还包括:

当有至少一种类型的问答网页所包含的知识类观点被更新时,获取所述被更新的知识类观点,所述更新包括增加、删除、修改中的至少一种;

根据所述被更新的知识类观点,更新该类型的问答网页对应的目标答案。

可选地,所述类型相同指所述目标问答网页中包含的问题与所述知识类问题具有相同或相近含义。

依据本发明的另一个方面,提供了一种基于自然搜索结果提供精确观点的搜索装置,包括:

查询模块,适于当接收到对知识类问题的搜索请求时,从问答数据库中查询与所述知识类问题类型相同的至少一个目标问答网页;

第一获取模块,适于获取预与所述目标问答网页相对应的目标答案,其中,所述目标答案是预先对所述问答数据库中资源进行挖掘得到的针对所述知识类问题的精确观点;

集成模块,适于由所述至少一个目标问答网页集成针对所述知识类问题的搜索结果,并将所述目标答案添加至所述搜索结果的预设位置。

可选地,所述至少一个目标问答网页对应唯一的目标答案;

所述集成模块还适于:

从所述至少一个目标问答网页中选择一个目标问答网页作为最佳目标问答网页;

将所述目标答案添加至所述最佳目标问答网页对应的预设位置。

可选地,所述集成模块还适于:

按照预设参数对所述至少一个目标问答网页进行排序,所述预设参数包括对各目标问答网页的访问率和/或各目标问答网页中包含的问题与所述知识类问题的相关度;

将排序最前的目标问答网页确定为所述最佳目标问答网页。

可选地,各问答目标网页对应各自的目标答案;

所述集成模块,还适于将所述目标答案添加至各自对应的目标问答网页所对应的预设位置。

可选地,所述集成模块,适于将所述目标答案以预设形式添加至所述搜索结果的预设位置,所述预设形式包括图标形式和/或文本形式。

可选地,所述装置还包括:

第二获取模块,适于从所述问答数据库中获取类型相同的问答网页;

第三获取模块,适于获取所述类型相同的问答网页各自包含的知识类观点;

确定模块,适于从所述知识类观点中提取精确观点作为所述类型相同的问答网页对应的目标答案。

可选地,所述第二获取模块还适于:

根据所述问答数据库中每个问答网页的预设文本,确定所述每个问答网页的类型,所述预设文本包括标题、摘要、关键字中的至少一项;

根据所述每个问答网页的类型,获取所述类型相同的问答网页。

可选地,所述确定模块还适于:

计算每个知识类观点的出现率;

将所述出现率最高的知识类观点确定为所述精确观点,作为所述类型相同的问答网页对应的目标答案。

可选地,所述装置还包括:

存储模块,适于将所述类型相同的问答网页与其对应的目标答案存储在预设分布式存储数据库中;

相应地,所述第一获取模块,还适于从所述预设分布式存储数据库中获取与所述目标问答网页相对应的目标答案。

可选地,所述预设分布式存储数据库为HBase数据库。

可选地,所述装置还包括:

第四获取模块,适于当有至少一种类型的问答网页所包含的知识类观点被更新时,获取所述被更新的知识类观点,所述更新包括增加、删除、修改中的至少一种;

更新模块,适于根据所述被更新的知识类观点,更新该类型的问答网页对应的目标答案。

可选地,所述类型相同指所述目标问答网页中包含的问题与所述知识类问题具有相同或相近含义。

采用本发明实施例提供的技术方案,能够在接收到对知识类问题的搜索请求时,获取与知识类问题类型相同的多个目标问答网页对应的目标答案,进而由多个目标问答网页集成针对该知识类问题的搜索结果,并将目标答案添加至搜索结果的预设位置进行显示,使得用户在搜索知识类问题时,能够一目了然地查看到搜索结果上显示的目标答案,即针对知识类问题的精确观点,而无需再通过多个搜索路径寻找并分析包含目标答案的内容,大幅度缩短了用户搜索知识类问题时的判断和分析过程,进而很好地满足了针对知识类问题的问答需求。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

根据下文结合附图对本发明具体实施例的详细描述,本领域技术人员将会更加明了本发明的上述以及其他目的、优点和特征。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1是根据本发明一个实施例的一种基于自然搜索结果提供精确观点的搜索方法的示意性流程图;

图2是根据本发明一个实施例的一种基于自然搜索结果提供精确观点的搜索方法中搜索结果的示意性界面图;

图3是根据本发明一个实施例的一种基于自然搜索结果提供精确观点的搜索方法的示意性流程图;

图4是根据本发明一个实施例的一种基于自然搜索结果提供精确观点的搜索方法中搜索结果的示意性界面图;

图5是根据本发明一个实施例的一种基于自然搜索结果提供精确观点的搜索方法中搜索结果的示意性界面图;

图6是根据本发明一个实施例的一种基于自然搜索结果提供精确观点的搜索装置的示意性框图;

图7是根据本发明一个实施例的一种基于自然搜索结果提供精确观点的搜索装置的示意性框图;

图8是根据本发明一个实施例的一种基于自然搜索结果提供精确观点的搜索装置的示意性框图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

图1是根据本发明一个实施例的一种基于自然搜索结果提供精确观点的搜索方法的示意性流程图。如图1所示,该方法一般性地可包括以下步骤S101-S103:

步骤S101,当接收到对知识类问题的搜索请求时,从问答数据库中查询与知识类问题类型相同的至少一个目标问答网页。

其中,知识类问题指对应有唯一的明确观点的问题。例如,问题“小孩头发黄是缺锌吗?”对应有明确观点“是”;问题“塑料餐具能用微波炉加热吗?”对应有明确观点“不能”,等等,这些问题由于都具有明确观点,因此都属于知识类问题,知识类问题对应的明确观点即为知识类观点。

与知识类问题类型相同的至少一个目标问答网页中,所述的“类型相同”指目标问答网页中包含的问题与知识类问题具有相同或相近含义。例如,以下两个问题“塑料餐具能用微波炉加热吗?”以及“塑料餐具可以用微波炉加热吗?”由于具有相同含义,因此属于类型相同的问题,其对应的问答网页属于类型相同的问答网页。

步骤S102,获取与目标问答网页相对应的目标答案。

其中,目标答案是预先对问答数据库中资源进行挖掘得到的针对知识类问题的精确观点。问答数据库中的资源包括知识类问题以及涵盖知识类观点的内容。

步骤S103,由至少一个目标问答网页集成针对知识类问题的搜索结果,并将目标答案添加至搜索结果的预设位置。

为使用户能清晰明了地查看到搜索结果中所包括的目标答案,预设位置通常设定为搜索结果中较为明显的位置,例如,预设位置可以是搜索结果中与目标问答网页对应的网页标题相邻的位置,本实施例对此不做限定。

采用本发明实施例提供的技术方案,能够在接收到对知识类问题的搜索请求时,获取与知识类问题类型相同的多个目标问答网页对应的目标答案,进而由多个目标问答网页集成针对该知识类问题的搜索结果,并将目标答案添加至搜索结果的预设位置进行显示,使得用户在搜索知识类问题时,能够一目了然地查看到搜索结果上显示的目标答案,即针对知识类问题的精确观点,而无需再通过多个搜索路径寻找并分析包含目标答案的内容,大幅度缩短了用户搜索知识类问题时的判断和分析过程,进而很好地满足了针对知识类问题的问答需求。

上述步骤S102中,获取到的与至少一个目标问答网页相对应的目标答案可能有唯一一个,也可能有多个。以下针对这两种情况分别进行说明。

在一个实施例中,与知识类问题类型相同的至少一个目标问答网页对应唯一的目标答案。此时,步骤S103可执行为以下步骤:首先,从至少一个目标问答网页中选择一个目标问答网页作为最佳目标问答网页;其次,将目标答案添加至最佳目标问答网页对应的预设位置。该实施例通过将目标答案添加至最佳目标问答网页对应的预设位置,使得用户对知识类问题进行搜索时,可一目了然地查从最佳目标问答网页处查看到所需要的目标答案,而无需再通过多个路径一步步寻找并分析包含目标答案的内容,从而大幅度缩短了用户搜索知识类问题时的判断和选择过程,为用户搜索问题提供了方便。

上述实施例中,从至少一个目标问答网页中选择最佳目标问答网页的方式为:首先,按照预设参数对至少一个目标问答网页进行排序,预设参数包括对各目标问答网页的访问率和/或各目标问答网页中包含的问题与知识类问题的相关度;其次,将排序最前的目标问答网页确定为最佳目标问答网页。具体的,当预设参数为对各目标问答网页的访问率时,可将访问率最高的目标问答网页确定为最佳目标问答网页;当预设参数为各目标问答网页中包含的问题与知识类问题的相关度时,可将该相关度最高的目标问答网页确定为最佳目标问答网页;当预设参数包括对各目标问答网页的访问率和各目标问答网页中包含的问题与知识类问题的相关度时,可预设上述访问率和相关度各自对应的权重,并根据各自对应的权重计算最终的参考值,然后将参考值最高的目标问答网页确定为最佳目标问答网页。

以知识类问题“孩子头发发黄是缺锌吗?”为例说明上述实施例中如何展示搜索结果。图2示出了该实施例中搜索结果的示意性界面图。如图2所示,当用户搜索知识类问题“孩子头发发黄是缺锌吗?”时,界面上显示由与该知识类问题类型相同的多个目标问答网页集成的搜索结果(图中仅示出部分目标问答网页),并且,搜索结果中排在最前的目标问答网页为用户访问率最高的问答网页,即为最佳目标问答网页。目标答案“是”显示在最佳目标问答网页的标题左下方。为使显示结果更加明确,目标答案还可以设置各类突出性地显示效果,例如字体加粗加黑、字体采用鲜艳的颜色、字体采用背景颜色、字体加下划线等等,图2中所示的目标答案采用字体加背景颜色的方式。

上述实施例中,在对问答数据库中资源进行挖掘以得到目标答案时,可按照如图3所示的步骤S301-S303执行:

步骤S301,从问答数据库中获取类型相同的问答网页。

其中,“类型相同”指各问答网页中包含的问题具有相同或相近含义。执行该步骤时,首先,根据问答数据库中每个问答网页的预设文本,确定每个问答网页的类型,预设文本包括标题、摘要、关键字中的至少一项;其次,根据每个问答网页的类型,获取类型相同的问答网页。

步骤S302,获取类型相同的问答网页各自包含的知识类观点。

步骤S303,从知识类观点中提取精确观点作为类型相同的问答网页对应的目标答案。

从知识类观点中提取精确观点时,可按照如下步骤进行提取:首先,计算每个知识类观点的出现率;其次,将出现率最高的知识类观点确定为精确观点,作为类型相同的问答网页对应的目标答案。例如,与知识类问题“孩子头发发黄是缺锌吗?”类型相同的各问答网页中,知识类观点“是”在所有知识类观点中的出现率站到90%,而知识类观点“不是”在所有知识类观点中的出现率站到10%,这说明知识类观点“是”的出现率远远高于知识类观点“不是”的出现率,因此可确定知识类观点“是”为该类型相同的问答网页对应的目标答案。

在另一个实施例中,与知识类问题类型相同的至少一个目标问答网页对应各自的目标答案。此时,步骤S103可执行为以下步骤:将目标答案添加至各自对应的目标问答网页所对应的预设位置。

该实施例中,由于知识类问题对应的知识类观点往往只有肯定观点和否定观点两种,二者中仅有一种知识类观点是正确的,因此为了给用户提供最精确的目标答案,可预先按照上述步骤步骤S301-S303提取出与知识类问题类型相同的问答网页对应的目标答案,并将该目标答案作为与该类型相同的至少一个目标问答网页各自对应的目标答案。也就是说,各目标问答网页各自对应的目标答案是相同的。仍以知识类问题“孩子头发发黄是缺锌吗?”为例,如图4所示,各目标问答网页各自对应的目标答案都为“是”,因此在每个目标问答网页的标题右方都显示有目标答案“是”。这种实施方式能够为用户提供唯一的精确答案,免去用户从多个精确答案中再次判断的过程。

当然,也可直接将上述步骤S302中获取到的多个知识类观点分别确定为各自对应的目标问答网页的目标答案。以知识类问题“感冒可以吃海鲜吗?”为例,如图5所示,在图中示出的部分搜索结果中,第一个目标问答网页对应的目标答案为“不可以”,第二个目标问答网页对应的目标答案为“可以”。这种实施方式能够为用户提供每个问答网页所包含的精确答案,从而使用户能够主观判断出所需的精确答案。

在上述任一实施例中,执行步骤S103时,可将目标答案以预设形式添加至搜索结果的预设位置,预设形式包括图标形式和/或文本形式。

在上述任一实施例中,上述方法还包括以下步骤:将类型相同的问答网页与其对应的目标答案存储在预设分布式存储数据库中。其中,预设分布式存储数据库可以是HBase数据库。由于问答数据库中包括大量的问答网页,因此需要存储的问答网页与其对应的目标答案数据十分庞大,而HBase数据库作为一种开源的非关系型分布式数据库,非常适合搭建大规模结构化存储集群,因此,将问答网页与其对应的目标答案存储在HBase数据库中是一种非常优化的存储方式。当然,预设分布式存储数据库也可以是其他用于存储大数据的数据库,本发明并不仅限定为HBase数据库。

在上述任一实施例中,上述方法还包括以下步骤:当预设分布式存储数据库中有至少一种类型或至少一个问答网页所包含的知识类答案被更新时,获取被更新的知识类答案,更新包括增加、删除、修改中的至少一种;根据被更新的知识类答案,更新问答网页对应的目标答案。该实施例中,及时更新问答网页对应的目标答案,使得终端为用户提供的搜索结果中的目标答案更加精确。

基于上文各个实施例提供的基于自然搜索结果提供精确观点的搜索方法,基于同一发明构思,本发明实施例还提供了一种基于自然搜索结果提供精确观点的搜索装置。

图6示出了本发明实施例中一种基于自然搜索结果提供精确观点的搜索装置的示意性框图。如图6所示,该装置至少包括查询模块610、第一获取模块620和集成模块630。

以下介绍本发明实施例的基于自然搜索结果提供精确观点的搜索装置的各组成或器件的功能以及各部分间的连接关系:

查询模块610,适于当接收到对知识类问题的搜索请求时,从问答数据库中查询与知识类问题类型相同的至少一个目标问答网页;

第一获取模块620,与查询模块610耦合,适于获取预与目标问答网页相对应的目标答案,其中,目标答案是预先对问答数据库中资源进行挖掘得到的针对知识类问题的精确观点;

集成模块630,与第一获取模块620耦合,适于由至少一个目标问答网页集成针对知识类问题的搜索结果,并将目标答案添加至搜索结果的预设位置。

在一个实施例中,至少一个目标问答网页对应唯一的目标答案;

集成模块630还适于:

从至少一个目标问答网页中选择一个目标问答网页作为最佳目标问答网页;

将目标答案添加至最佳目标问答网页对应的预设位置。

在一个实施例中,集成模块630还适于:

按照预设参数对至少一个目标问答网页进行排序,预设参数包括对各目标问答网页的访问率和/或各目标问答网页中包含的问题与知识类问题的相关度;

将排序最前的目标问答网页确定为最佳目标问答网页。

在一个实施例中,各问答目标网页对应各自的目标答案;

集成模块630,还适于将目标答案添加至各自对应的目标问答网页所对应的预设位置。

在一个实施例中,集成模块630,还适于将目标答案以预设形式添加至搜索结果的预设位置,预设形式包括图标形式和/或文本形式。

在一个实施例中,如图7所示,上述装置还包括:

第二获取模块640,适于从问答数据库中获取类型相同的问答网页;

第三获取模块650,与第二获取模块640耦合,适于获取类型相同的问答网页各自包含的知识类观点;

确定模块660,与第三获取模块650耦合,适于从知识类观点中提取精确观点作为类型相同的问答网页对应的目标答案。

在一个实施例中,第二获取模块640还适于:

根据问答数据库中每个问答网页的预设文本,确定每个问答网页的类型,预设文本包括标题、摘要、关键字中的至少一项;

根据每个问答网页的类型,获取类型相同的问答网页。

在一个实施例中,确定模块660还适于:

计算每个知识类观点的出现率;

将出现率最高的知识类观点确定为精确观点,作为类型相同的问答网页对应的目标答案。

在一个实施例中,如图8所示,上述装置还包括:

存储模块670,适于将类型相同的问答网页与其对应的目标答案存储在预设分布式存储数据库中;

相应地,第一获取模块620,与存储模块670耦合,还适于从预设分布式存储数据库中获取与目标问答网页相对应的目标答案。

在一个实施例中,预设分布式存储数据库为HBase数据库。

在一个实施例中,上述装置还包括:

第四获取模块,适于当有至少一种类型的问答网页所包含的知识类观点被更新时,获取被更新的知识类观点,更新包括增加、删除、修改中的至少一种;

更新模块,与第四获取模块耦合,适于根据被更新的知识类观点,更新该类型的问答网页对应的目标答案。

在一个实施例中,类型相同指目标问答网页中包含的问题与知识类问题具有相同或相近含义。

根据上述任意一个优选实施例或多个优选实施例的组合,本发明实施例能够达到如下有益效果:

采用本发明实施例提供的装置,能够在接收到对知识类问题的搜索请求时,获取与知识类问题类型相同的多个目标问答网页对应的目标答案,进而由多个目标问答网页集成针对该知识类问题的搜索结果,并将目标答案添加至搜索结果的预设位置进行显示,使得用户在搜索知识类问题时,能够一目了然地查看到搜索结果上显示的目标答案,即针对知识类问题的精确观点,而无需再通过多个搜索路径寻找并分析包含目标答案的内容,大幅度缩短了用户搜索知识类问题时的判断和分析过程,进而很好地满足了针对知识类问题的问答需求。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的基于自然搜索结果提供精确观点的搜索装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

至此,本领域技术人员应认识到,虽然本文已详尽示出和描述了本发明的多个示例性实施例,但是,在不脱离本发明精神和范围的情况下,仍可根据本发明公开的内容直接确定或推导出符合本发明原理的许多其他变型或修改。因此,本发明的范围应被理解和认定为覆盖了所有这些其他变型或修改。

本发明实施例公开了A1、一种基于自然搜索结果提供精确观点的搜索方法,包括:

当接收到对知识类问题的搜索请求时,从问答数据库中查询与所述知识类问题类型相同的至少一个目标问答网页;

获取与所述目标问答网页相对应的目标答案,其中,所述目标答案是预先对所述问答数据库中资源进行挖掘得到的针对所述知识类问题的精确观点;

由所述至少一个目标问答网页集成针对所述知识类问题的搜索结果,并将所述目标答案添加至所述搜索结果的预设位置。

A2、根据A1所述的方法,其中,所述至少一个目标问答网页对应唯一的目标答案;

所述将所述目标答案添加至所述搜索结果的预设位置,包括:

从所述至少一个目标问答网页中选择一个目标问答网页作为最佳目标问答网页;

将所述目标答案添加至所述最佳目标问答网页对应的预设位置。

A3、根据A1或A2所述的方法,其中,从所述至少一个目标问答网页中选择一个目标问答网页作为最佳目标问答网页,包括:

按照预设参数对所述至少一个目标问答网页进行排序,所述预设参数包括对各目标问答网页的访问率和/或各目标问答网页中包含的问题与所述知识类问题的相关度;

将排序最前的目标问答网页确定为所述最佳目标问答网页。

A4、根据A1-A3任一项所述的方法,其中,各目标问答网页对应各自的目标答案;

所述将所述目标答案添加至所述搜索结果的预设位置,包括:

将所述目标答案添加至各自对应的目标问答网页所对应的预设位置。

A5、根据A1-A4任一项所述的方法,其中,将所述目标答案添加至所述搜索结果的预设位置,包括:

将所述目标答案以预设形式添加至所述搜索结果的预设位置,所述预设形式包括图标形式和/或文本形式。

A6、根据A1-A5任一项所述的方法,其中,所述方法还包括:

从所述问答数据库中获取类型相同的问答网页;

获取所述类型相同的问答网页各自包含的知识类观点;

从所述知识类观点中提取精确观点作为所述类型相同的问答网页对应的目标答案。

A7、根据A1-A6任一项所述的方法,其中,从所述问答数据库中获取类型相同的问答网页,包括:

根据所述问答数据库中每个问答网页的预设文本,确定所述每个问答网页的类型,所述预设文本包括标题、摘要、关键字中的至少一项;

根据所述每个问答网页的类型,获取所述类型相同的问答网页。

A8、根据A1-A7任一项所述的方法,其中,从所述知识类观点中提取精确观点作为所述类型相同的问答网页对应的目标答案,包括:

计算每个知识类观点的出现率;

将所述出现率最高的知识类观点确定为所述精确观点,作为所述类型相同的问答网页对应的目标答案。

A9、根据A1-A8任一项所述的方法,其中,所述方法还包括:

将所述类型相同的问答网页与其对应的目标答案存储在预设分布式存储数据库中;

相应地,所述获取与所述目标问答网页相对应的目标答案,包括:

从所述预设分布式存储数据库中获取与所述目标问答网页相对应的目标答案。

A10、根据A1-A9任一项所述的方法,其中,所述预设分布式存储数据库为HBase数据库。

A11、根据A1-A10任一项所述的方法,其中,所述方法还包括:

当有至少一种类型的问答网页所包含的知识类观点被更新时,获取所述被更新的知识类观点,所述更新包括增加、删除、修改中的至少一种;

根据所述被更新的知识类观点,更新该类型的问答网页对应的目标答案。

A12、根据A1-A11任一项所述的方法,其中,所述类型相同指所述目标问答网页中包含的问题与所述知识类问题具有相同或相近含义。

B13、一种基于自然搜索结果提供精确观点的搜索装置,包括:

查询模块,适于当接收到对知识类问题的搜索请求时,从问答数据库中查询与所述知识类问题类型相同的至少一个目标问答网页;

第一获取模块,适于获取预与所述目标问答网页相对应的目标答案,其中,所述目标答案是预先对所述问答数据库中资源进行挖掘得到的针对所述知识类问题的精确观点;

集成模块,适于由所述至少一个目标问答网页集成针对所述知识类问题的搜索结果,并将所述目标答案添加至所述搜索结果的预设位置。

B14、根据B13所述的装置,其中,所述至少一个目标问答网页对应唯一的目标答案;

所述集成模块还适于:

从所述至少一个目标问答网页中选择一个目标问答网页作为最佳目标问答网页;

将所述目标答案添加至所述最佳目标问答网页对应的预设位置。

B15、根据B13或B14所述的装置,其中,所述集成模块还适于:

按照预设参数对所述至少一个目标问答网页进行排序,所述预设参数包括对各目标问答网页的访问率和/或各目标问答网页中包含的问题与所述知识类问题的相关度;

将排序最前的目标问答网页确定为所述最佳目标问答网页。

B16、根据B13-B15任一项所述的装置,其中,各问答目标网页对应各自的目标答案;

所述集成模块,还适于将所述目标答案添加至各自对应的目标问答网页所对应的预设位置。

B17、根据B13-B16任一项所述的装置,其中,所述集成模块,适于将所述目标答案以预设形式添加至所述搜索结果的预设位置,所述预设形式包括图标形式和/或文本形式。

B18、根据B13-B17任一项所述的装置,其中,所述装置还包括:

第二获取模块,适于从所述问答数据库中获取类型相同的问答网页;

第三获取模块,适于获取所述类型相同的问答网页各自包含的知识类观点;

确定模块,适于从所述知识类观点中提取精确观点作为所述类型相同的问答网页对应的目标答案。

B19、根据B13-B18任一项所述的装置,其中,所述第二获取模块还适于:

根据所述问答数据库中每个问答网页的预设文本,确定所述每个问答网页的类型,所述预设文本包括标题、摘要、关键字中的至少一项;

根据所述每个问答网页的类型,获取所述类型相同的问答网页。

B20、根据B13-B19任一项所述的装置,其中,所述确定模块还适于:

计算每个知识类观点的出现率;

将所述出现率最高的知识类观点确定为所述精确观点,作为所述类型相同的问答网页对应的目标答案。

B21、根据B13-B20任一项所述的装置,其中,所述装置还包括:

存储模块,适于将所述类型相同的问答网页与其对应的目标答案存储在预设分布式存储数据库中;

相应地,所述第一获取模块,还适于从所述预设分布式存储数据库中获取与所述目标问答网页相对应的目标答案。

B22、根据B13-B21任一项所述的装置,其中,所述预设分布式存储数据库为HBase数据库。

B23、根据B13-B22任一项所述的装置,其中,所述装置还包括:

第四获取模块,适于当有至少一种类型的问答网页所包含的知识类观点被更新时,获取所述被更新的知识类观点,所述更新包括增加、删除、修改中的至少一种;

更新模块,适于根据所述被更新的知识类观点,更新该类型的问答网页对应的目标答案。

B24、根据B13-B23任一项所述的装置,其中,所述类型相同指所述目标问答网页中包含的问题与所述知识类问题具有相同或相近含义。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号