首页> 中国专利> 列表型知识的问答库构建方法、作答方法、装置及系统

列表型知识的问答库构建方法、作答方法、装置及系统

摘要

本发明实施例公开了一种列表型知识的问答库构建方法、作答方法、装置及系统。本发明所述的方法,包括:获取用户输入的问题信息;从所述问题信息中获取特征信息;根据所述问题信息,确定所述问题信息中包含的知识类型;所述知识类型包括:列表型知识和其他型知识;如果所述问题信息中包含列表型知识,确定所述特征信息是否存在于该所述问题信息关联的列表型知识表中;如果是,则调用与所述问题信息对应的问答模型,生成肯定答案;如果否,则调用与所述问题信息对应的问答模型,生成否定答案。避免对列表型知识给出其他形式答案的情况发生,从而,保证了在回答包含列表型知识的问题时,以正确的回答形式生成答案。

著录项

  • 公开/公告号CN107229675A

    专利类型发明专利

  • 公开/公告日2017-10-03

    原文格式PDF

  • 申请/专利权人 北京神州泰岳软件股份有限公司;

    申请/专利号CN201710295510.X

  • 申请日2017-04-28

  • 分类号G06F17/30(20060101);G06F17/27(20060101);

  • 代理机构11363 北京弘权知识产权代理事务所(普通合伙);

  • 代理人逯长明;许伟群

  • 地址 100089 北京市海淀区万泉庄路28号万柳新贵大厦A座601室

  • 入库时间 2023-06-19 03:30:12

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-07-17

    专利权的转移 IPC(主分类):G06F16/242 登记生效日:20200629 变更前: 变更后: 申请日:20170428

    专利申请权、专利权的转移

  • 2019-12-20

    专利实施许可合同备案的生效 IPC(主分类):G06F16/242 合同备案号:X2019990000215 让与人:北京神州泰岳软件股份有限公司 受让人:中科鼎富(北京)科技发展有限公司 发明名称:列表型知识的问答库构建方法、作答方法、装置及系统 申请公布日:20171003 授权公告日:20190205 许可种类:排他许可 备案日期:20191127 申请日:20170428

    专利实施许可合同备案的生效、变更及注销

  • 2019-02-05

    授权

    授权

  • 2017-11-03

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20170428

    实质审查的生效

  • 2017-10-03

    公开

    公开

说明书

技术领域

本发明涉及语言信息处理技术领域,尤其涉及一种列表型知识的问答库构建方法、作答方法、装置及系统。

背景技术

随着互联网技术的发展,人们对网络的依赖逐渐加深,如图1所示,当人们遇到问题时,习惯在互联网上找到所需的答案。例如,人们在生活中常常遇到这样的问题:“打火机可以带上飞机吗?”“发胶可以带上飞机吗?”“酒精是乘飞机的违禁品吗?”这类问题属于判断某个概念是否具有某一类属性的问题,用户在提问此类问题时,希望得到的回答形式是肯定回答或者是否定回答。

在现有技术公开了一种问答系统,,这种问答系统在接收到用户输入的问题时,首先从问题中提取全部关键词,然后,根据这些关键词,从问题库中找出包含关键词最多的问题,并将该包含关键词最多的问题所对应的答案返回给用户。例如,用户提问:“铅笔是乘飞机的违禁品吗?”问答系统从问题中找到了“铅笔”“飞机”“违禁品”三个关键词,然后,问答系统根据这三个关键词在问题库中查找到一个包含“飞机”“违禁品”问题:“飞机的违禁品是什么?”并返回给用户与该问题对应的答案:“飞机违禁品有:煤油、汽油、雷管、炸药、酒精……”。

从现有技术示出的一种问答系统可以看出,当用户提出了一个判断某个概念是否具有某一类属性的问题时,现有技术的问答系统给出了一个陈述性的答案,将具有某一类属性的全部同位概念都罗列了出来,并没有针对某个概念是否具有某一类属性给出肯定回答或者否定回答。因此,现有技术的问答系统在回答判断某个概念是否具有某一类属性的问题时,无法保证以正确的回答形式生成答案。

发明内容

本发明提供了一种列表型知识的问答库构建方法、作答方法、装置及系统,以解决现有技术中存在的问题。

第一方面,本发明实施例提供了一种列表型知识问答库构建方法,所述列表型知识问答库包括多个列表型知识问答项,每个所述列表型知识问答项包括一个列表型知识表和一个关联的问答模型,每个所述列表型知识表中包含多个同位概念;每个所述问答模型中包含多个预设问题信息,每个所述预设问题信息对应一个肯定答案和一个否定答案,所述方法包括:创建内容为空的列表型知识问答库;创建所述列表型知识表的集合,所述列表型知识表的集合包含至少一个列表型知识表;创建所述问答模型的集合,所述问答模型的集合包含至少一个问答模型,每个所述问答模型包含识别信息;根据所述识别信息,查找所述表名与所述识别信息匹配的所述列表型知识表;对每一对匹配到的所述列表型知识表和所述问答模型关联建立列表型知识问答项,生成列表型知识问答库。

第二方面,本发明实施例提供了一种列表型知识的作答方法,所述方法包括:获取用户输入的问题信息;从所述问题信息中获取特征信息;根据所述问题信息,确定所述问题信息中包含的知识类型;所述知识类型包括:列表型知识和其他型知识;如果所述问题信息中包含列表型知识,确定所述特征信息是否存在于该所述问题信息关联的列表型知识表中;如果是,则调用与所述问题信息对应的问答模型,生成肯定答案;如果否,则调用与所述问题信息对应的问答模型,生成否定答案。

第三方面,本发明实施例提供了一种列表型知识的答案生成装置,所述装置包括:第一获取模块,用于获取用户输入的问题信息;第二获取模块,用于从所述问题信息中获取特征信息;第一确定模块,用于根据所述问题信息,确定所述问题信息中包含的知识类型;所述知识类型包括:列表型知识和其他型知识;第二确定模块,用于在所述问题信息中包含列表型知识时,确定所述特征信息是否存在于该所述问题信息关联的列表型知识表中;执行模块,用于在所述第二确定模块的输出结果为是时,调用与所述问题信息对应的问答模型,生成肯定答案;以及,用于在所述第二确定模块的输出结果为否时,调用与所述问题信息对应的问答模型,生成否定答案。

第四方面,本发明实施例提供了一种列表型知识的问答系统,所述问答系统包括:用户模块,用于用户提出问题和接收答案;数据存储模块,用于存储列表型知识问答库;处理模块,用于根据用户提问,生成肯定答案或者否定答案;传输模块,用于实现用户模块、处理模块和数据存储模块之间的数据传输;其中,所述处理模块至少包括:处理器和程序存储器;所述处理器被配置为:获取用户输入的问题信息;从所述问题信息中获取特征信息;根据所述问题信息,确定所述问题信息中包含的知识类型;所述知识类型包括:列表型知识和其他型知识;如果所述问题信息中包含列表型知识,确定所述特征信息是否存在于该所述问题信息关联的列表型知识表中;如果是,则调用与所述问题信息对应的问答模型,生成肯定答案;如果否,则调用与所述问题信息对应的问答模型,生成否定答案。

本发明实施例提供的技术方案考虑到用户在使用问答系统进行提问时,经常会提问判断某个概念是否具有某一类属性的问题,这种类型的问题,回答形式有肯定回答或者否定回答;因此,本发明实施例提供的技术方案在用户提问时,获取用户输入的问题信息;从所述问题信息中获取特征信息;根据所述问题信息,确定所述问题信息中包含的知识类型;所述知识类型包括:列表型知识和其他型知识;如果所述问题信息中包含列表型知识,确定所述特征信息是否存在于该所述问题信息关联的列表型知识表中;如果是,则调用与所述问题信息对应的问答模型,生成肯定答案;如果否,则调用与所述问题信息对应的问答模型,生成否定答案。从而,能够实现从用户提出的问题信息中,准确地确定出包含列表型知识的问题信息,并根据问题信息中的特征信息是否是与问题信息关联的列表型知识中的同位概念信息,生成与问题信息对应的肯定答案或否定答案,避免对列表型知识给出其他形式答案的情况,从而,保证了在回答包含列表型知识的问题时,以正确的回答形式生成答案。

附图说明

为了更清楚地说明本发明的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为现有技术问答系统的应用场景图;

图2为本发明列表型知识问答库结构示意图;

图3为本发明实施例提供的一种列表型知识问答库构建方法的流程图;

图4为本发明实施例生成的列表型知识问答库内容示意图;

图5为本发明实施例提供的一种列表型知识的作答方法的第一实施例流程图;

图6为本发明实施例提供的一种列表型知识的作答方法的第一实施例步骤S230的流程图;

图7为本发明实施例提供的一种列表型知识的作答方法的第二实施例流程图;

图8为本发明实施例提供的一种列表型知识的作答方法的第二实施例步骤S230的流程图;

图9为本发明实施例提供的一种列表型知识的答案生成装置框图;

图10为本发明实施例提供的一种列表型知识问答系统的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

在知识系统中,某些概念具有某个共同的上位属性,因此,可以将这些具有同一个上位属性的概念以列表形式归类,并称之为列表型知识,如果把具有某个上位属性的所有同位概念列举在一个列表中,就构成了一个列表型知识表;对于列表型知识来说,存在于列表型知识表中的概念属于肯定概念,不存在于列表型知识表中的概念属于否定概念;如果对一个列表型知识表关联一个用于判断某个概念是否是该列表型知识表对应的上位属性的问答模型,就构成了一项列表型知识问答项;如果把若干项列表型知识问答项集合到一个库中,就构成了一个列表型知识问答库。此外,对于否定概念,还可以在列表型知识表中建立否定概念表,此时,列表型知识表中同时存在肯定概念表和否定概念表。

参见图2,为列表型知识问答库结构示意图。这个列表型知识问答库具有多个列表型知识问答项,每个列表型知识问答项由一个列表型知识表和一个问答模型组成,每个列表型知识表中包含若干个同位概念,并以其上位属性作为表名;每个问答模型中包含至少一个预设问题信息,每个预设问题信息对应设置有一个肯定答案和一个否定答案。

应当说明的是,预设问题信息可以为一个预设问题,每个预设问题对应设置一个肯定答案和一个否定答案。这种情况下,肯定答案和否定答案的具体表述可以针对不同问题设定。

此外,针对不同用户提出的问题中可能会存在多个相似问题的情况,在列表型知识问答库中,预设问题信息也可以为一个预设问题组,该预设问题组由多个相似的预设问题组成,并可选择该预设问题组中的一个标准预设问题,作为该预设问题组的组名,标准预设问题可以通过对用户提问的问题作统计,选择出现频率最高的问题作为标准预设问题;其余作为标准预设问题对应的扩展预设问题。

例如:一个预设问题组包括如下相似问题:“#识别信息#是乘飞机的违禁品吗”;“#识别信息#可以带上飞机吗”;“#识别信息#能带上飞机吗”······此时该预设问题组的肯定答案可以为“#识别信息#是乘飞机的违禁品,不可以带上飞机”;其否定答案可以为“#识别信息#不是乘飞机的违禁品,可以带上飞机”。

本发明实施例提供了一种列表型知识问答库构建方法。图3为本发明实施例提供的一种列表型知识问答库构建方法的流程图。如图3所示,所述方法可以包括以下步骤:

在步骤S110中,创建所述列表型知识表的集合,所述列表型知识表的集合包含至少一个列表型知识表;

本实施例中,创建列表型知识表所需要的表名和同位概念,可以由用户录入或者从外部文件导入。

示例地,本实施例中提供的方法能够识别以下格式的导入信息:

*飞机违禁品;汽油,煤油,柴油,酒精,雷管,炸药,……,打火机*

*……;……,……,……,……,……,……*

以上信息中,星号、分号、逗号为列表型知识表的标识信息,两个星号“*”之间的信息为列表型知识表的内容,两个星号“*”之间的内容以表名信息开始,后用分号“;”隔开,分号“;”后的内容为同位概念信息,所有同位概念信息之间用逗号“,”隔开。

本实施例提供的方法中,处理器在接收到用户导入的包含以上格式的信息后,能够识别标识信息,并根据标识信息中对应的内容识别出表名和同位概念,并生成列表型知识表的集合。

在步骤S120中,创建所述问答模型的集合,所述问答模型的集合包含至少一个问答模型,每个所述问答模型包含识别信息;

本实施例中创建问答模型所需要的至少一个预设问题信息,以及每个预设问题信息对应一个肯定答案和一个否定答案可以由用户录入或者从外部文件导入。

示例地,本实施例中提供的方法能够识别以下格式的导入信息:

以上信息中,两个井号“#”之间的信息为识别信息;大括号、双斜线、单斜线为问答模型的标识信息,其中,大括号之间的内容表示一个问答模型所包含的内容,两个双斜线“//”之间的信息表示一个预设问题信息以及该问题信息对应的肯定答案和否定答案,两个双斜线“//”之间的内容以预设问题信息开始,后用单斜线“/”隔开,单斜线“/”后的内容为预设问题信息对应的肯定答案和否定答案,两个答案之间用单斜线“/”隔开。

示例地,本实施例中,如果要导入包含预设问题信息组的问答模型,可以通过导入以下格式为文件实现:

以上信息中,<>和</>为预设问题信息组的开始标识和结束标识,开始标识中的内容为标准预设问题信息,结束标识中的内容为该预设问题信息组的肯定答案和否定答案,其中,肯定答案和否定答案之间用“/”隔开,开始标识和结束标识之间的信息为预设问题信息组中的预设问题信息,预设问题信息之间用“/”隔开。本实例中,预设问题信息组的有益效果是,能够实现对多个相似的预设问题信息进行聚合,并统一设置问答模型,能够减少列表型知识问答库的数据量,提高检索效率。

本实施例提供的方法接收到用户导入的包含以上格式的信息后,能够识别标识信息,并根据标识信息中对应的内容识别出每个问答模型,以及每个问答模型中包含的每个预设问题信息和对应的肯定答案与否定答案,并生成包含至少一个问答模型的集合。

在步骤S130中,查找所述列表型知识表的集合中是否存在具有相同所述表名的所述列表型知识表;如果存在,则执行步骤S131,合并具有相同所述表名的所述列表型知识表。

本实施例中,步骤S130的作用是防止列表型知识表中出现表达相同列表型知识的列表型知识表,从而,能避免在对该列表型知识问答库使用的过程中出现查询结果不唯一的情况,避免错误发生。

在步骤S140中,根据所述识别信息,查找所述表名与所述识别信息匹配的所述列表型知识表。

本实施例中,问答模型的识别信息为预设问题信息中两个井号“#”之间的信息。

示例地,在步骤S120的示例中,对于“#识别信息#是乘飞机的违禁品吗”以及“#识别信息#可以带上飞机吗”来说,识别信息中的内容是“飞机违禁品”,因此,根据“飞机违禁品”查找到步骤S110中的表名“飞机违禁品”与识别信息匹配。

在步骤S150中,对每一对匹配到的所述列表型知识表和所述问答模型关联建立列表型知识问答项,生成列表型知识问答库。

示例地,本实施例生成的列表型知识问答库内容示意图,如图4所示。

此外,在本实施例中,列表型知识表中还可以包含一个否定概念表,该否定概念表中包含了该列表型知识的否定概念。此形式的列表型知识表同时包含一个同位概念表和一个否定概念表。

示例地,对于“飞机违禁品”来说,它所对应的否定概念有:“毛巾,书本,眼镜,衣服,……”等。对于这些否定概念来说,可以按照在步骤S120,在表名为“飞机违禁品”的列表型知识表中建立否定概念表。

本发明实施例提供了一种列表型知识的作答方法。

图5为本发明实施例提供的一种列表型知识的作答方法的第一实施例流程图。如图5所示,所述方法可以包括以下步骤:

在步骤S210中,获取用户输入的问题信息。

本实施例中,用户输入的问题信息可以通过用户在PC、手机、平板等终端设备的文字键入、语音输入等方式获得。例如,本实施例中,用户通过手机端文字输入:“汽油是乘飞机的违禁品吗”

在步骤S220中,从所述问题信息中获取特征信息;

本实施例中,特征信息是用户提出的问题信息中的一个名词性概念信息,当用户提出的问题信息包含列表型知识时,该特征信息可能是问题信息包含的列表型知识的肯定概念或者否定概念。由于用户对列表型知识提问时会用以下方式提问:“汽油能带上飞机吗?”“毛巾可以带上飞机吗”“大熊猫是哺乳动物吗?”这些问题均会出现例如“能”“可以”“是”等在疑问句中表示判断意义的判断词,此外,通过上述问题还可以看出,这些判断词前均出现了名词性概念,且这些名词性概念往往是各自的列表型知识中的肯定概念或者否定概念;因此,查找到问题信息中的判断词,就能准确地获取问题信息中的特征信息。

示例地,在步骤S220中,“汽油是乘飞机的违禁品吗”包含判断词“是”,因此,本实施例从用户提出的问题信息中提取了“是”前面的概念性名词“汽油”,并作为该问题信息的特征信息。

在步骤S230中,根据所述问题信息,确定所述问题信息中包含的知识类型;所述知识类型包括:列表型知识和其他型知识。

参见图6,本实施例中,步骤S230具体包括以下步骤:

在步骤S2311中,将所述列表型知识问答库中所有的预设问题信息分别与所述问题信息计算第一相似度值;

可选地,本实施例中,计算第一相似度值的方法可采用余弦法。

示例地,本实施例采用余弦法计算第一相似度值前,可预先对所有预设问题信息分别生成特征向量,在对所有预设问题信息分别生成特征向量时,首先去除预设问题信息中的识别信息,然后再进行计算,得到包含所有预设问题信息特征向量的集合{v1,v2,v3……vn},当计算第一相似度值时,对问题信息生成特征向量q,然后通过余弦法得到第一相似度值,所述余弦法可用以下公式表示(m表示向量维度,i表示第i个预设问题信息):

q={q1,q2,q3,……,qm}

vn={vn1,vn2,vn3,……,vnm}

sim(q,vi)=cos(q,vi)

本实施例中,如果问答模型中包含预设问题信息组,可对预设问题信息组的标准预设问题信息生成特征向量,作为该预设问题信息组的特征向量。

本实施例中,在执行步骤S2311后,最终得到一个第一相似度值计算结果的集合:

{sim(q,v1),sim(q,v2),sim(q,v3),……,sim(q,vn)}

该集合中每个第一相似度值对应了一个预设问题信息,由于问题信息中的词频不能为负数,因此,第一相似度值的范围在[0,1]之间:

在步骤S2312中,将所有第一相似度值计算结果排序,确定最高第一相似度值。

示例地,根据试验得到,本实施例对所有第一相似度值排序,最终确定最高第一相似度值sim(q,vi)=0.82,该最高第一相似度值对应的预设问题信息是:“#识别信息#是乘飞机的违禁品吗”。

在步骤S2313中,确定所述最高第一相似度值是否高于第一预设分界值;如果所述最高相似度高于第一预设分界值,则所述问题信息中包含列表型知识;否则,所述问题信息中包含其他型知识。

示例地,本实施例中,第一预设分界值的大小决定了步骤S230在确定问题信息中包含的知识类型时的精度,所述第一预设分界值在[0,1]之间,更接近区间上限;第一预设分界值过大会导致将部分包含列表型知识的问题信息漏判;第一预设分界值过小,会导致将部分包含其他型知识的问题信息误判成包含列表型知识的问题信息。第一预设分界值的合理值,可以通过对本方法进行复现试验,采用多轮调试的方法确定。本实施例通过试验将第一预设分界值设置为p=0.75。本实施例在步骤S2312中确定的最高第一相似度值为sim(q,vi)=0.82,由于sim(q,vi)=0.82>p=0.75,即所述最高第一相似度值高于第一预设分界值,因此,所述问题信息中包含列表型知识。

在步骤S240中,如果所述问题信息中包含所述列表型知识,确定所述特征信息是否存在于该所述问题信息关联的列表型知识表中。

示例地,本实施例在步骤S2312中确定了最高第一相似度值,以及最高第一相似度值对应的预设问题信息:“#识别信息#是乘飞机的违禁品吗”,由于在列表型知识问答库中,每个列表型知识问答项的列表型知识表和问答模型之间建立有关联,因此,本实施例在执行步骤S240时,查询所述特征信息“汽油”是否是“#识别信息#是乘飞机的违禁品吗”所在问答模型关联的列表型知识表中的同位概念信息;查询的结果是在列表型知识表中找到了同位概念信息“汽油”,因此,本实施例中,所述特征信息是与所述问题信息关联的列表型知识表中的同位概念信息。

在步骤S251和步骤S252中,根据步骤S240的结果相应地执行步骤S251或步骤S252。

示例地,本实施例在步骤S240中,“确定所述特征信息是否是与所述问题信息关联的列表型知识表中的同位概念信息”的结果为是,因此,执行步骤S251,在与所述问题信息对应的问答模型中,所述问题信息对应的预设问题信息为:“#识别信息#是乘飞机的违禁品吗”,该预设问题信息的肯定回答为:“#识别信息#是乘飞机的违禁品”。因此,本实施例在步骤S251生成肯定答案:“汽油是乘飞机的违禁品”。

本实例中,如果预设问题信息为预设问题组,且用户提出的问题信息是:“打火机可以带上飞机吗”时,在步骤S230中匹配到的是具有标准预设问题信息“#识别信息#可以带上飞机吗”的预设问题组,依然可以通过标准预设问题信息,执行步骤S240生成问题答案,且所有匹配到同一个预设问题信息组的问题信息,都适用于该预设问题信息组对应的肯定答案或者否定答案。

进一步地,本实施例提供的一种列表型知识的作答方法,在执行过程中还会遇到包含列表型知识否定概念的问题信息和包含其他型知识的问题信息。

示例地,对于包含列表型知识否定概念的问题信息,例如“毛巾可以带上飞机吗”,本实施例在步骤S210中,获取用户输入的问题信息;在步骤S220中,根据问题信息中的判断词“可以”,获取问题信息中的特征信息“毛巾”;在步骤S230中,确定最高第一相似度值为sim(q,vi)=0.78,该最高第一相似度值对应的预设问题信息是:“#识别信息#可以带上飞机吗”,该最高相似度高于第一预设分界值p=0.75,因此,该问题信息中包含列表型知识;在步骤S240中,通过查询确定,“毛巾”不是与“#识别信息#可以带上飞机吗”关联的列表型知识表中的同位概念信息;根据步骤S240的确定结果,执行步骤S252,由于,与“毛巾可以带上飞机吗”对应的预设问题信息为“#识别信息#可以带上飞机吗”,且该预设问题信息的否定回答为:“#识别信息#不是乘飞机的违禁品,可以带上飞机”;因此,本实施例在回答“毛巾可以带上飞机吗”时,在步骤S240生成否定答案:“毛巾不是乘飞机的违禁品,可以带上飞机”。示例地,对于包含其他型知识的问题信息,例如“毛巾是怎样制作的”,本实施例在步骤S210中,获取用户输入的问题信息;在步骤S220中,根据问题信息中的判断词“是”,获取问题信息中的特征信息“毛巾”;但是,步骤S230中,确定最高第一相似度值为sim(q,vi)=0.09,低于第一预设分界值p=0.75,因此,该问题信息中包含其他型知识,执行本实施的步骤S260。

示例地,对于包含其他型知识的问题信息,例如“汽油的燃烧产物有哪些”,本实施例在步骤S210中,获取用户输入的问题信息;在步骤S220中,由于该问题信息中不包含判断词,所以,本步骤获取的特征信息为空;步骤S230中,确定最高第一相似度值为sim(q,vi)=0.02,低于第一预设分界值p=0.75,因此,该问题信息包含其他型知识,执行本实施的步骤S260。

示例地,如果列表型知识库的列表型知识表中同时包含肯定概念表和否定概念表,执行本步骤时,可以通过确定特征信息是存在于列表型知识的同位概念表中还是否定概念表中的方法,调用与所述问题信息对应的问答模型。

示例地,当用户提问“毛巾可以带上飞机吗”时,如果列表型知识表中同时包含肯定概念表和否定概念表,在执行步骤S240时,确定“毛巾”存在与列表型知识的否定概念表中,因此执行步骤S252。

在步骤S260中,如果所述问题信息中包含其他型知识,跳转至其他作答方法。

本实施例提供的列表型知识的作答方法,能够在用户提出的问题信息中,准确地确定出包含列表型知识的问题信息,并根据问题信息中的特征信息是否是与问题信息关联的列表型知识中的同位概念信息,生成与问题信息对应的肯定答案或否定答案,避免对列表型知识给出其他形式答案的情况发生,从而,保证了在回答包含列表型知识的问题时,以正确的回答形式生成答案。

图7为本发明实施例提供的一种列表型知识的作答方法的第二实施例流程图。如图7所示,本实施例与第一实施例的一个区别在于,在步骤S230之前增加步骤S310。

在步骤S310中,分析所述特征信息的内容是否为空;如果为空,则所述问题信息中包含其他型知识。

示例地,对于用户提出的问题信息:“汽油是乘飞机的违禁品吗”“毛巾可以带上飞机吗”以及“毛巾是怎样制作的”,在步骤S220中分别获取到了特征信息:“汽油”“毛巾”以及“毛巾”,这些特征信息均不为空,因此执行步骤S230;对于用户提出的问题信息:“汽油的燃烧产物有哪些”,在步骤S220中获取到内容为空的特征信息,因此,直接确定该问题信息中包含其他型知识,并执行步骤S260。

本实施例中,步骤S310的有益效果是,在执行步骤S230之前,先通过分析特征信息的内容是否为空;找出一部分包含其他型知识的问题信息,并跳过步骤S230和步骤S240,直接执行步骤S260,减少答案生成过程中的计算量,提高答案生成速度。

如图8所示,本实施例与第一实施例的另一个区别在于,在执行步骤S230时,采用的具体方法不同,本实施例中,步骤S230具体包括以下区别步骤:

在步骤S2321中,从所述问题信息中提取标签信息;

示例地,本实施例中,用户提出问题:“打火机是乘飞机的违禁品吗”,在步骤S2321中,通过识别问题信息中的判断词,将“飞机的违禁品”作为标签信息并提取。

在步骤S2322中,将所述标签信息分别与列表型知识问答库中的每个列表型知识表的表名计算第二相似度值;。

可选地,步骤S2322计算相似度也可以采用余弦法,并可预先对所有列表型知识表的表名计算特征向量ki,生成特征向量的集合{k1,k2,k3……kn}。

本实施例中相似度计算方法可以参考步骤S2311执行,并得到一个相似度结果的集合:

{sim(b,k1),sim(b,k2),sim(b,k3),……,sim(b,kn)}。

其中,b为标签信息的特征向量。

在步骤S2323中,根据所述第二相似度值计算结果,确定最高第二相似度值所对应的目标列表型知识表。

示例地,本实施例中,根据第二相似度值计算结果,确定与本实施例中标签信息“飞机的违禁品”具有最高第二相似度的表名是“飞机违禁品”,最高第二相似度值为该表名对应的列表型知识表即为目标列表型知识表。

在步骤S2324中,确定所述最高第二相似度值是否高于第二预设分界值;如果所述最高第二相似度值高于所述第二预设分界值,则所述问题信息中包含列表型知识;否则,所述问题信息中包含其他型知识。

示例地,本实施例中,第二预设分界值的大小决定了步骤S230在确定问题信息中包含的知识类型时的精度,所述第二预设分界值在[0,1]之间,更接近区间上限;第二预设分界值过大会导致将部分包含列表型知识的问题信息漏判;第二预设分界值过小,会导致将部分包含其他型知识的问题信息误判成包含列表型知识的问题信息。第二预设分界值的合理值,可以通过对本方法进行复现试验,采用多轮调试的方法确定。本实施例通过试验将第二预设分界值设置为p2=0.72。本实施例中最高第二相似度值为sim(b,ki)=0.84,由于sim(b,ki)=0.84>p2=0.72,即所述最高第二相似度值高于第二预设分界值,因此,所述问题信息中包含列表型知识

在步骤S2325中,将所述目标列表型知识表关联的所有预设问题信息分别与所述问题信息计算第三相似度值。本步骤中,第三相似度值计算方法参考步骤S2311,此处不在赘述。

在步骤S2336中,将所有第三相似度值计算结果排序,确定最高第三相似度值。本步骤中,确定最高第三相似度值的方法参考步骤S2312,此处不在赘述。

在步骤S2327中,确定与所述最高第三相似度值对应的预设问题信息。该预设问题信息关联的列表型知识表即为所述问题信息关联的列表型知识表。

本实例中的其他步骤与第一实施例相同。

本实施例步骤S230采用的方法,使用问题信息中的标签信息与列表型知识表的表名计算相似度的方法,确定问题信息是否包含列表型知识,然后再从找到的列表型知识表对应的问答模型中匹配预设问题信息,能够减少匹配预设问题信息时的计算量,提高匹配速度。

此外,在最高第二相似度值所对应的目标列表型知识表中只有一个肯定答案和一个否定答案的前提下(如预设问题信息为一个预设问题组),使用问题信息中的标签信息与列表型知识表的表名计算相似度的方法,确定问题信息是否包含列表型知识,如果有,则进一步提取问题信息中的特征信息(参见S220),然后再判断提取出的特征信息是否包含在最高第二相似度值所对应的目标列表型知识表中,如果包含,则生成肯定答案;如果不包含,则生成否定答案。这样可进一步减少匹配预设问题信息时的计算量,提高匹配速度。

本实施例提供的列表型知识的作答方法,能够在用户提出的问题信息中,准确地确定出包含列表型知识的问题信息,并根据问题信息中的特征信息是否为与问题信息关联的列表型知识中的同位概念信息,生成与问题信息对应的肯定答案或否定答案,避免对列表型知识给出其他形式答案的情况发生,从而,保证了在回答包含列表型知识的问题时,以正确的回答形式生成答案。

本发明实施例提供了一种列表型知识的答案生成装置。图9为本发明实施例提供的一种列表型知识的答案生成装置框图。如图9所示,所述装置包括:

第一获取模块510,用于获取用户输入的问题信息;

第二获取模块520,从所用户信息中获取特征信息;

第一确定模块530,用于根据所述问题信息,确定所述问题信息中包含的知识类型;所述知识类型包括:列表型知识和其他型知识;

第二确定模块540,用于在所述问题信息中包含列表型知识时,确定所述特征信息是否存在于该所述问题信息关联的列表型知识表中;

执行模块550,用于在所述第二确定模块540的判断结果为是时,调用与所述问题信息对应的问答模型,生成肯定答案;

以及,

用于在所述第二确定模块540的判断结果为否时,调用与所述问题信息对应的问答模型,生成否定答案;。

本实施例提供的列表型知识的答案生成装置,能够在用户提出的问题信息中,准确地确定出包含列表型知识的问题信息,并根据问题信息中的特征信息是否为与问题信息关联的列表型知识中的同位概念信息,生成与问题信息对应的肯定答案或否定答案,避免对列表型知识给出其他形式答案的情况发生,从而,保证了在回答包含列表型知识的问题时,以正确的回答形式生成答案。

本发明实施例提供了一种列表型知识问答系统。图10是本发明实施例提供了一种列表型知识问答系统的示意图,如图10所示,所述问答系统包括:

用户模块610,用于用户提出问题和接收答案;

本实施例中,用户模块610可以是个人计算机,移动电话、平板设备、数字广播终端以及其他具有信息输入输出功能的设备。所述信息输入输出功能包括但不局限于手写输入、文字输入输出、语音输入输出、视频输出。

数据存储模块620,用于存储列表型知识问答库;

本实施例中,数据存储模块620可以是用于存储列表型知识问答库的硬盘存储器,闪存存储器,数据服务器,服务器阵列,网络存储器,云服务器,分布式服务器等。

处理模块630,用于根据用户提问,生成肯定答案或者否定答案;

传输模块640,用于实现用户模块610、处理模块630和数据存储模块620之间的数据传输;

本实施例中,传输模块640可以包括用于实现数据传输的网络设备,包括调制解调器,数据交换机,路由器,服务器,应答机等,传输模块640的数据传输媒介可以是以太网,移动通信网络,无线局域网,数字广播网络等。

本实施例中,所述处理模块630至少包括:处理器631和程序存储器632;

所述处理器631被配置为:

获取用户输入的问题信息;

从所述问题信息中获取特征信息;

根据所述问题信息,确定所述问题信息中包含的知识类型;所述知识类型包括:列表型知识和其他型知识;

如果所述问题信息中包含列表型知识,确定所述特征信息是否存在于该所述问题信息关联的列表型知识表中;

如果是,则调用与所述问题信息对应的问答模型,生成肯定答案;

如果否,则调用与所述问题信息对应的问答模型,生成否定答案。

本发明可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。

本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。

应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号