首页> 中国专利> 基于人工智能技术的类脑问答系统

基于人工智能技术的类脑问答系统

摘要

本申请实施例提供一种基于人工智能技术的类脑问答系统,包括:问答环境模块、问答模式模块以及问答方法模块;所述问答环境模块用于提供问答配置和数据;所述问答模式用于生成对话流;所述问答方法模块包括任务问答单元、知识问答单元、检索问答单元以及闲聊问答单元;本申请能够通过对五要素“人”、“事”、“物”、“地”、“组织”进行挖掘、分析构建知识图谱,结合自然语言理解加知识推理,提供领域知识型问题回答;通过行业开放知识,提供检索问答以及闲聊问题问答。

著录项

  • 公开/公告号CN112632239A

    专利类型发明专利

  • 公开/公告日2021-04-09

    原文格式PDF

  • 申请/专利权人 南京三眼精灵信息技术有限公司;

    申请/专利号CN202011460792.2

  • 申请日2020-12-11

  • 分类号G06F16/332(20190101);G06F16/33(20190101);G06F16/36(20190101);

  • 代理机构11489 北京中政联科专利代理事务所(普通合伙);

  • 代理人陈超

  • 地址 211100 江苏省南京市江宁开发区迎翠路7号

  • 入库时间 2023-06-19 10:32:14

说明书

技术领域

本申请涉及人工智能领域,具体涉及一种基于人工智能技术的类脑问答系统。

背景技术

在新模式下的信息化智能建设中,如何打通集中式的数据和知识中心与基层行业工作人员的应用使用,使平台中积累的多方面信息数据和广大专家的知识智慧, 能够赋能基层用户,在不同的业务场景中进行应用和验证,是行业中函待解决的 痛点问题。在此背景下,为了解决上述的痛点问题,建立基于类脑问答技术,研 发行业智能助手,提供语音、文本、图片等多模态的交互方式,通过自然语言处 理和其他AI技术,理解终端用户的需求,基于庞大的行业知识进行推理和计算, 满足用户的场景业务需求。同时,基于终端用户的反馈,对行业积累的专家知识 和行业智慧进行反馈升级,不断优化,最终促进整个行业智慧的升华。

在近几年的智能助手市场上,国内互联网公司在智能语音方面也发展迅速,其 中互联网企业和金融企业是智能助手发展的两个前端行业。

随着移动互联网在国内的迅猛发展,国内互联网企业凭借自带的天然C端优 势,不断依靠其庞大的用户量、大量真实场景下的数据积累、以及背后强大的搜 索,形成各自特点的智能助手,协助用户完成相应的产品推荐、服务引导等,代 表产品如百度秘书、小度、华为助手、小米助手等。技术侧,则通过积累形成开 放开发平台,如百度的DuerOS、UNIT;金融行业最初是从简化复杂的业务办理 流程、节省人力物力的角度,引入智能客服助理,帮助用户高效完成相应的业务 操作,而随着技术和数据的积累,又催生出后续的增值服务推荐、生活助理、智 能理财等发展方向,代表产品如各银行虚拟形象助手。

目前国内智能助手在其他行业的应用还较少,形式多以客服、知识问答形式出现,缺少对行业知识的运用,在智能识别、推理解答方面还有较大欠缺。

1.多数面向个人用户,解决生活助理等,缺乏面向行业的类脑问答。

2.行业用户的现有知识类型丰富,不同数据的重要性和特点差异很大,缺乏 有效整合利用。

3.智能类助手通常采用单一问答形式,覆盖场景有限,无法理解用户真正意 图,问答回复准确率低。

发明内容

针对现有技术中的问题,本申请提供一种基于人工智能技术的类脑问答系统, 能够通过对五要素“人”、“事”、“物”、“地”、“组织”进行挖掘、分析构建知识 图谱,结合自然语言理解加知识推理,提供领域知识型问题回答;通过行业开放 知识,提供检索问答以及闲聊问题问答。

为了解决上述问题中的至少一个,本申请提供以下技术方案:

第一方面,本申请提供一种基于人工智能技术的类脑问答系统,包括:问答 环境模块、问答模式模块以及问答方法模块;

所述问答环境模块用于提供问答配置和数据;

所述问答模式用于生成对话流;

所述问答方法模块包括任务问答单元、知识问答单元、检索问答单元以及闲聊 问答单元。

进一步地,所述问答模式包括:

任务问答和知识问答切换单元,用于判断是否有匹配候选问句,如果有候选问句,则判断候选问句置信度是否大于设定置信度阈值,其中,设定的置信度阈值 α,候选问句置信度为βn,如果βn>α,则直接进行返回复,如果βn<α则切换 进入知识问答环节进行回复,如果没有匹配候选问句,则切换进入下一个知识问 答环节。

进一步地,所述问答模式包括:

知识问答和检索问答切换单元,用于判断知识库是否有查询结果,如果没有查 询结果,则切换进入下一个检索问答环节,如果有匹配结果,则直接进行返回。

进一步地,所述问答模式包括:

检索问答和闲聊问答切换单元,用于判断是否有匹配候选答复,如果有候选答复,判断候选答复相似度是否大于设定相似度阈值,其中,设定的相似度阈值α, 候选答复相似度值为γn,如果γn>α则返回进行回复,如果γn<α则切换进入 闲聊问答环节进行回复。

进一步地,所述任务问答单元用于执行以下步骤:

接收任务问答环节转发的问题;

采用自然语言处理工具对问题短语进行切分,产生候选实体,并对节点对应 元素类别进行标注。基于句法依存分关系,例如主谓宾、动宾结构、主从句结构 等匹配形成的规则,构建查询结构;

利用查询图生成多个SPARQL,并利用数据集中的部分信息对多个SPARQL 进行过滤和优化,其中就包括歧义的消除;

访问知识图库,执行SPARQL进行查询,返回结果;

如果没有结果返回,则切换到检索问答机器人进行回复。

进一步地,所述检索问答单元用于执行以下步骤:

接收知识问答环节转发的问题;

接收用户问题,对用户输入的问题和文档库数据计算相似度,通过matching 模型计算问题相似度作为候选回复,输出matching score转为为特征;

采用ranking模型对候选回复进行排序,把相似度较高的文本所对应的答案返 回给用户;

如果没有匹配答复或者相似度太低,切换到闲聊问答机器人进行回复。

进一步地,所述闲聊问答单元用于执行以下步骤:

接收检索问答环节转发的问题;

通过用户问题,采用序列模型和Attention生成回复。

由上述技术方案可知,本申请提供一种基于人工智能技术的类脑问答系统,通 过对五要素“人”、“事”、“物”、“地”、“组织”进行挖掘、分析构建知识图谱, 结合自然语言理解加知识推理,提供领域知识型问题回答;通过行业开放知识, 提供检索问答以及闲聊问题问答。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例 或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的 附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳 动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例中的基于人工智能技术的类脑问答系统的示意图;

图2为本申请实施例中的智能问答对话流程示意图;

图3为本申请实施例中的任务问答流程示意图;

图4为本申请实施例中的知识问答流程示意图;

图5为本申请实施例中的检索问答流程示意图;

图6为本申请实施例中的闲聊问答流程示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施 例中的附图,对本申请实施例中的技术方案进行清楚、完整的描述,显然,所描 述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施 例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施 例,都属于本申请保护的范围。

考虑到目前国内智能助手在其他行业的应用还较少,形式多以客服、知识问 答形式出现,缺少对行业知识的运用,在智能识别、推理解答方面还有较大欠缺 的问题,本申请提供一种基于人工智能技术的类脑问答系统,通过对五要素“人”、 “事”、“物”、“地”、“组织”进行挖掘、分析构建知识图谱,结合自然语言理解 加知识推理,提供领域知识型问题回答;通过行业开放知识,提供检索问答以及 闲聊问题问答。

为了能够通过对五要素“人”、“事”、“物”、“地”、“组织”进行挖掘、分析 构建知识图谱,结合自然语言理解加知识推理,提供领域知识型问题回答;通过 行业开放知识,提供检索问答以及闲聊问题问答,本申请提供一种基于人工智能 技术的类脑问答系统的实施例,所述基于人工智能技术的类脑问答系统具体包含 有如下内容:

问答环境模块、问答模式模块以及问答方法模块;

所述问答环境模块用于提供问答配置和数据;

所述问答模式用于生成对话流;

所述问答方法模块包括任务问答单元、知识问答单元、检索问答单元以及闲 聊问答单元。

从上述描述可知,本申请实施例提供的基于人工智能技术的类脑问答系统, 能够通过对五要素“人”、“事”、“物”、“地”、“组织”进行挖掘、分析构建知识 图谱,结合自然语言理解加知识推理,提供领域知识型问题回答;通过行业开放 知识,提供检索问答以及闲聊问题问答。

在本申请的基于人工智能技术的类脑问答系统的一实施例中,还可以具体包 含如下内容:

所述问答模式包括:

任务问答和知识问答切换单元,用于判断是否有匹配候选问句,如果有候选 问句,则判断候选问句置信度是否大于设定置信度阈值,其中,设定的置信度阈 值α,候选问句置信度为βn,如果βn>α,则直接进行返回复,如果βn<α则切 换进入知识问答环节进行回复,如果没有匹配候选问句,则切换进入下一个知识 问答环节。

在本申请的基于人工智能技术的类脑问答系统的一实施例中,还可以具体包 含如下内容:

所述问答模式包括:

知识问答和检索问答切换单元,用于判断知识库是否有查询结果,如果没有 查询结果,则切换进入下一个检索问答环节,如果有匹配结果,则直接进行返回。

在本申请的基于人工智能技术的类脑问答系统的一实施例中,还可以具体包 含如下内容:

所述问答模式包括:

检索问答和闲聊问答切换单元,用于判断是否有匹配候选答复,如果有候选 答复,判断候选答复相似度是否大于设定相似度阈值,其中,设定的相似度阈值 α,候选答复相似度值为γn,如果γn>α则返回进行回复,如果γn<α则切换 进入闲聊问答环节进行回复。

在本申请的基于人工智能技术的类脑问答系统的一实施例中,还可以具体包 含如下内容:

所述任务问答单元用于执行以下步骤:

接收任务问答环节转发的问题;

采用自然语言处理工具对问题短语进行切分,产生候选实体,并对节点对应 元素类别进行标注。基于句法依存分关系,例如主谓宾、动宾结构、主从句结构 等匹配形成的规则,构建查询结构;

利用查询图生成多个SPARQL,并利用数据集中的部分信息对多个SPARQL 进行过滤和优化,其中就包括歧义的消除;

访问知识图库,执行SPARQL进行查询,返回结果;

如果没有结果返回,则切换到检索问答机器人进行回复。

在本申请的基于人工智能技术的类脑问答系统的一实施例中,还可以具体包 含如下内容:

所述检索问答单元用于执行以下步骤:

接收知识问答环节转发的问题;

接收用户问题,对用户输入的问题和文档库数据计算相似度,通过matching 模型计算问题相似度作为候选回复,输出matching score转为为特征;

采用ranking模型对候选回复进行排序,把相似度较高的文本所对应的答案返 回给用户;

如果没有匹配答复或者相似度太低,切换到闲聊问答机器人进行回复。

在本申请的基于人工智能技术的类脑问答系统的一实施例中,还可以具体包 含如下内容:

所述闲聊问答单元用于执行以下步骤:

接收检索问答环节转发的问题;

通过用户问题,采用序列模型和Attention生成回复。

为了更进一步说明本方案,本申请还提供一种应用上述基于人工智能技术的 类脑问答系统实现基于人工智能技术的类脑问答系统的具体应用实例,具体包含 有如下内容:

参见图1,类脑问答助手包括问答环境、问答方法两部分,问答环境包括数据 准备、问答配置;问答方法包括任务问答、知识问答、检索问答、闲聊问答,汇 聚专业领域的知识模型、通用知识领域的知识图谱,开放领域的文档库。

所述问答环境提供问答配置和数据,作为问答实现方法环节前置工作,进行 说明。

参见图2,所述问答模式用于生成对话流,例如任务问答->知识问答->检索 问答->闲聊问答。具体的:

1.任务问答->知识问答

判断是否有匹配候选问句,如果有候选问句,判断候选问句置信度是否大于 设定置信度阈值,设定的置信度阈值α,候选问句置信度为βn,如果βn>α则 直接进行返回复,如果βn<α则切换进入知识问答环节进行回复;如果没有匹配候 选问句,则切换进入下一个知识问答环节。

2.知识问答->检索问答

判断知识库是否有查询结果,如果没有查询结果,则切换进入下一个检索问 答环节,如果有匹配结果,则直接进行返回。

3.检索问答->闲聊问答

判断是否有匹配候选答复,如果有候选答复,判断候选答复相似度是否大于 设定相似度阈值,设定的相似度阈值α,候选答复相似度值为γn,如果γn>α则 返回进行回复,如果γn<α则切换进入闲聊问答环节进行回复。

4.闲聊问答

生成回复起到兜底作用。

所述问答方法包括任务问答模块,面向任务的对话模块,满足特定场景下, 用户具有明确目的,希望得到特定的满足,机器人主要通过多轮对话状态追踪, 不断反馈修正,来达到理解用户意图,从而完成目标任务或者活动。数据准备阶 段,通过对特定应用场景进行业务分析、数据建模,将模型分析结果作为任务问 题答案进行回复。问答配置阶段,根据应用场景模型的关键要素及上下文活动节 点,构建对话流程,配置问句、槽位标注(槽位、实体)、答复(接口形式访问模 型结果)。

参见图3,所述任务问答流程为:

1.输入,接收用户输入的问题

2.问句匹配,判断问句类别,根据已配置的问句中找到最匹配的一条。匹配的 模式有几种方法:编辑距离、短文本向量余弦相似度找到最到匹配的问句,输出 置信度

3.输出判定,如果置信度太低不符合设定的置信度阈值,或者没有批文的问句 则切换到问答知识环节进行回复

4.槽位提取,返回的问句进行槽位匹配,提取识别实体,获取意图属性

5.任务回复,触发系统动作,调用后台服务,输入参数为实体,调用业务模型 接口。

所述知识问答模块,利用语义解析方式,对自然语言进行语法分析,将查询 转换成逻辑表达式,然后利用知识库的语义信息将逻辑表达式转换成知识库查询, 最终通过查询知识库得到查询结果。

所述知识问答模块,融合多种问题类型的问答,包括事实性问题、解释性问 题、关联性问题、比较性问题等,满足用户多样性问答的需求。

所述知识问答模块,通过汇聚行业知识数据,结合行业要素特点,分析人、 事、物、组织之间的关系,以实体、概念、关系的三元组形式进行表述,构建关 系数据,形成通用行业知识图库。

参见图4,所述知识问答流程为:

1.输入,接收任务问答环节转发的问题。

2.语义解析,采用自然语言处理工具对问题短语进行切分,产生候选实体, 并对节点对应元素类别进行标注。基于句法依存分关系,例如主谓宾、动宾结构、 主从句结构等匹配形成的规则,构建查询结构。

3.构建查询,利用查询图生成多个SPARQL,并利用数据集中的部分信息对 多个SPARQL进行过滤和优化,其中就包括歧义的消除。

4.执行查询,访问知识图库,执行SPARQL进行查询,返回结果。

5.判定输出,如果没有结果返回,则切换到检索问答机器人进行回复。

所述检索问答预设语料库,通过接收用户输入的问题,在语料库查找相似的 问题,返回相应答案,采用倒排索引+TFIDF+余弦相似度方式来完成。

所述检索问答根据行业已有开放数据,例如工作制度、工作流程、开放邮件、 会议报告等数据汇聚构建文档库,采用索引形式进行存储,对外提供检索服务。

参见图5,所述检索问答流程为:

1.输入,接收知识问答环节转发的问题。

2.相似度匹配,接收用户问题,对用户输入的问题和文档库数据计算相似度, 通过matching模型计算问题相似度作为候选回复,输出matching score转为为特 征。

3.候选排序,采用ranking模型对候选回复进行排序,把相似度较高的文本所 对应的答案返回给用户。

4.判定输出,如果没有匹配答复或者相似度太低,切换到闲聊问答机器人进 行回复。

所述闲聊问答提供开放领域聊天问答,满足任意话题,采用seq2seq+attention生成式方式,自动生成答案进行回复。

所述闲聊问答基于文档库作为算法训练数据集,进行模型训练和预测。

参见图6,所述闲聊问答流程为:

1.输入,接收检索问答环节转发的问题。

2.回答生成,通过用户问题,采用序列模型(Sequence to Sequence,Seq2seq) +Attention生成回复。

有上述内容可知,本申请至少还可以实现以下技术效果:

a)通过问答机器人对话流程设计,层级递进匹配,问题回复准确率高。

b)通过本发明提供问答集成方式,问答类型丰富、支持任务问答、知识问答、 检索问答、闲聊问答。

c)通过本发明融合多种行业知识,涵盖知识范围广包括行业通用知识、行业 开放知识、行业场景知识。

本发明是参照根据本发明实施例的方法、设备(装置)、和计算机程序产品的 流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图 中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提 供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程 数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理 设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图 一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以 特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令 产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或 方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得 在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从 而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多 个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实 施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的 一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之 处,综上所述,本说明书内容不应理解为对本发明的限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号