首页> 中国专利> 基于逻辑增强的机器人互动方法、存储介质和电子设备

基于逻辑增强的机器人互动方法、存储介质和电子设备

摘要

本发明公开了一种基于逻辑增强的机器人互动方法、存储介质和电子设备,该方法包括:输入事件;采用编码器对事件进行编码,以得到编码信息;采用多个解码器对编码信息进行链式解码,以产生不同常识维度的推理结果信息;根据推理结果信息生成对应的文本描述。本发明可保证不同常识维度之间推理结果信息的逻辑一致性。

著录项

  • 公开/公告号CN113191161A

    专利类型发明专利

  • 公开/公告日2021-07-30

    原文格式PDF

  • 申请/专利权人 清华大学深圳国际研究生院;

    申请/专利号CN202110516711.4

  • 发明设计人 袁春;袁晨曦;

    申请日2021-05-12

  • 分类号G06F40/35(20200101);G06N3/04(20060101);G06N3/08(20060101);G06N5/04(20060101);

  • 代理机构44223 深圳新创友知识产权代理有限公司;

  • 代理人江耀纯

  • 地址 518055 广东省深圳市南山区西丽街道深圳大学城清华校区A栋二楼

  • 入库时间 2023-06-19 12:02:28

说明书

技术领域

本发明涉及自然语言处理技术领域,尤其涉及一种基于逻辑增强的机器人互动方法、存储介质和电子设备。

背景技术

随着人工智能技术的发展,人类与机器人的互动日益频繁。在人类与机器人互动过程中,固然需要机器人能够准确理解人类自然语言,然而对于人类自然语言的准确理解,需要对自然语言中的语义常识进行准确推理。常识推理(Commonsense Inference)是自然语言处理中一项重要而富有挑战性的任务,其目的是从观察到的事件中推理出未观察到的情况。人类有一个常识性知识的基础,很容易推理出与观察到的事件有关的未观测到的因果关系,但对于当今的人工智能系统来说是很难的。在此次实习中,我们主要研究推理事件因果关系的常识推理任务。举例说明,从给定的事件“X走进医院”,可以很容易地推断出事件的原因(X的意图、X在事件发生前需要做什么)和事件的影响(X和其他人的反应、X或其他人在事件发生后想做什么等)。我们的目标是生成推理结果的文本描述,而不是从一些候选对象中选择一个合理的选择。生成过程,更符合人类知识推理的过程,仍然是一个新的领域,有待探索。

相关技术中,使用基于编码器-解码器架构的神经模型的工作将任务视为端到端学习问题,并实现多任务学习以更好地表示事件。相关技术还提出利用迁移学习从大型预先训练的语言模型中转移直接线索,以及提出一种上下文感知的变分自编码器,从辅助数据集中学习事件背景知识。这些方法更多地关注于探索事件与推理结果之间的直接关系或引入背景常识知识来更好地表达事件,而很少关注不同常识维度之间的间接关系,并且存在着不同常识维度之间逻辑不一致的问题。

发明内容

本发明旨在至少在一定程度上解决相关技术中的技术问题之一,即相关技术提供的常识推理方法存在不同常识维度之间逻辑不一致的问题。为此,本发明的第一个目的在于提出一种基于逻辑增强的机器人互动方法,以保证不同常识维度之间推理结果信息的逻辑一致性。

本发明的第二个目的在于提出一种计算机可读存储介质。

本发明的第三个目的在于提出一种电子设备。

为达到上述目的,本发明通过以下技术方案实现:

一种基于逻辑增强的机器人互动方法,包括以下步骤:S1,输入事件;S2,采用编码器对所述事件进行编码,以得到编码信息;S3,采用多个解码器对所述编码信息进行链式解码,以产生不同常识维度的推理结果信息;S4,根据所述推理结果信息生成对应的文本描述。

可选地,在所述步骤S1之前,所述方法还包括:采用单词嵌入和位置编码对所述事件进行输入表示。

可选地,所述步骤S2中的所述编码器包括若干个区块,每一所述区块结构相同且不共享权重,并且每一所述区块包括多头自注意力层和前馈层。

可选地,所述步骤S3中的所述多个解码器结构相同且不共享权重,并且每一所述解码器对应一个常识维度。

可选地,每一所述解码器包括多头自注意力层、多头互注意力层和多头链式注意力层;其中,所述多头自注意力层用以捕获单词之间的依赖关系,并获取当前所述解码器的隐藏状态;所述多头互注意力层与所述编码器连接,用以获取所述编码器的所述编码信息;所述多头链式注意力层用以获取先前所述解码器的所述推理结果信息。

可选地,所述步骤S3中的所述产生不同常识维度的推理结果信息的步骤具体包括:

S3.1,建立基于外部常识语料库的定性预训练模型,以对所述事件的背景常识知识进行自学习;

S3.2,通过自学习后的所述定性预训练模型对不同常识维度的所述解码器的解码信息进行逻辑推理,以得到不同常识维度的所述推理结果信息。

可选地,所有的所述解码器通过链式注意力模块进行链接,以使每一所述解码器通过所述链式注意力模块利用先前所述解码器生成的推理结果信息指导当前常识维度的所述解码器进行逻辑推理。

可选地,所述链式注意力模块具体用于辅助每一所述解码器从先前所述解码器生成的所述推理结果信息中选择最重要的所述推理结果信息用以指导当前常识维度的所述解码器进行逻辑推理。

为达到上述目的,本发明第二方面提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时,实现上述所述的基于逻辑增强的机器人互动方法。

为达到上述目的,本发明第三方面提出了一种电子设备,包括存储器、处理器以及存储在存储器上的计算机程序,计算机程序被处理器执行时,实现上述所述的基于逻辑增强的机器人互动方法。

本发明至少具有以下优点:

本发明通过多个不同常识维度的解码器对编码信息进行链式逐步解码,并采用定性预训练模型对事件的背景常识进行自学习,以及在不同常识维度的解码器上增加链式注意力模块,使得解码器能够获取最重要的推理结果信息以准确地进行逻辑推理,并能够保证不同常识维度之间逻辑的一致性。

本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

图1为本发明一实施例提供的基于逻辑增强的机器人互动方法的流程图;

图2为本发明一实施例提供的机器人互动方法对应的模型示意图;

图3为本发明一实施例提供的链式注意力示意图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。

随着人工智能技术的发展,人类与机器人的互动日益频繁。例如,终端设备上的Siri等应用;聊天机器人,聊天机器人通过对人类自然语言进行常识推理,以理解对话者意图,从而进行更好的对话交流;智能家居,如小米的小爱同学等,其用于更好的理解人类的需求,从而实现家居系统的智能化。

可以理解的是,在人类与机器人互动过程中,需要机器人能够准确理解人类自然语言,然而对于人类自然语言的准确理解,需要对自然语言中的语义常识进行准确推理。

自然语言处理中的常识推理任务,是对于一个给定的事件,推理事件产生的原因和影响等常识维度。现有的神经网络方法更多地关注于对事件本身的理解和表征,而很少关注事件的不同常识维度(如因果)之间的关系,使得生成的结果在逻辑上不一致、不合理。所以,现有技术中提供的基于逻辑增强的常识推理方法如上所述存在不同常识维度之间逻辑不一致的问题。

为了保证常识推理的逻辑一致性,必须同时考虑事件本身和不同常识维度之间的间接关系。例如,假设“X走进医院”,如果我们认为X的意图是“看望病人”,那么我们可以推断他需要“买些花”,Y(病人)的反应是“感谢X”。否则,如果X的意图是“看医生”,那么在其他常识维度上的推断结果将完全不同。因此,我们提出了一种结合直接和间接关系的逻辑增强推理方法来构造一个逻辑链,以保证不同常识维度之间逻辑一致性的方式对常识推理进行建模。我们遵循事件开发的时间线来组织逻辑链,它以逻辑顺序连接不同的常识维度。在推理过程中,首先利用事件作为直接线索,直接推理出第一个常识维度,然后作为下一个常识维度的间接线索。进而在逻辑链的指导下,我们可以根据直接线索和间接线索对所有常识维度进行推理。

需要说明的是,对常识推理进行建模的模型为Chain Transformer(逻辑增强的链式常识推理模型),其结合了直接推理和间接推理来构建一个逻辑链,从而使推理在逻辑上更加一致。其中,直接推理可得到直接线索,直接线索主要是应用事件注意来利用事件编码器捕获的信息;间接推理可得到间接线索,间接线索为所有的不同的常识维度的解码器通过一个层次化注意模块即链式注意力模块进行链接,并通过链式注意力模块回顾前面的解码器,从而利用先前生成的推理结果来指导当前常识维度的解码器而得到的信息。

对于上述Chain Transformer模型,本实施例提供了一种应用于该模型的基于逻辑增强的机器人互动方法。下面参考附图描述本实施例的基于逻辑增强的机器人互动方法、存储介质和电子设备。

参考图1所示,本实施例提供的一种基于逻辑增强的机器人互动方法,包括以下步骤:

S1,输入事件。

在步骤S1之前,该方法还包括采用单词嵌入和位置编码对事件进行输入表示。

具体地,一个输入的事件表示为一个向量,然后利用序列的顺序信息,通过位置编码修改单词嵌入。位置编码与单词嵌入具有相同的常识维度,将单词嵌入和位置编码相加用以表示单词,然后如图2所示,将其用作基于multi-head self-attention(多头自注意力)的编码器的输入。其中,位置编码的计算如下式所示:

其中,pos指该词在句子中的位置,i指维度,d

在输入表示之后进行事件输入,例如输入一个句子x,然后通过多步推理的方式可得到不同常识维度的推理结果y,计算方式如下:

其中,x为输入的事件文本,y为输出的各种常识推理结果,k表示推理的维度数量。

S2,采用编码器对事件进行编码,以得到编码信息。

其中,步骤S2中的编码器包括若干个区块,每一所述区块结构相同且不共享权重,并且每一区块包括多头自注意力层和前馈层。

如图2所示,在输入表示之后,输入事件由一个基于multi-head self-attention的编码器进行编码,该编码器包含N个结构完全相同且不共享权重的块。每个区块被分解为两层,一个为多头自注意力层和一个为前馈层。该编码器的输入首先流经一个多头自注意力层,以有助于编码器捕捉事件中不同单词之间的依赖关系。然后将多头自注意力层的输出反馈给前馈神经网络即前馈层和标准化层。在进行N个区块编码之后,输入事件即被编码完成。

其中,编码器的计算方式如下:

其中,x为输入的事件,FFN指前馈神经网络,LayerNorm为指层标准化函数,Multihead为多头自注意力函数,x

其中,多头自注意力层的计算方式如下:

其中,W

S3,采用多个解码器对编码信息进行链式解码,以产生不同常识维度的推理结果信息。

其中,步骤S3中的多个解码器结构相同且不共享权重,并且每一解码器对应一个常识维度,以及所有的解码器通过链式注意力模块进行链接,以使每一解码器通过链式注意力模块利用先前解码器生成的推理结果信息指导当前常识维度的解码器进行逻辑推理。其中,链式注意力模块具体用于辅助每一解码器从先前解码器生成的推理结果信息中选择最重要的推理结果信息用以指导当前常识维度的解码器进行逻辑推理。

具体地,在对事件进行编码后,采用一系列的解码器对事件进行解码和推理,从而产生不同常识维度的推理结果信息。其中,所有解码器在结构上是相同的,并且不共享权重。为了对直接和间接推理过程进行建模,所有解码器都通过一个设计的链式注意力模块进行链接。本实施例的链式注意力如图3所示,可允许每个解码器利用先前解码器捕获的信息作为间接线索,以进行更合理和逻辑上一致的推断。

优选地,链式注意力的目标是利用先前解码器捕获的信息来更新当前解码器中的隐藏状态。考虑到并非所有先前获得的推理结果信息对当前常识维度都具有相同的重要性,我们设计了链式注意力以辅助每个解码器从间接线索中选择更重要的线索,从而更新解码器的隐藏状态。这种机制还可以最大限度地避免不同解码器之间的错误传播。如图3所示,链式注意力是一种层次化的注意结构,包括word-level attention(词级注意)和dimension-level attention(维度级别注意)。

作为一个示例,如图2所示,在词的层次上,首先用一个多头自注意力层层来捕捉同一推理中不同词之间的依赖关系,然后用解码器中的平均池化层和单层感知器将每个推理表示为一个向量,如下公式所示:

其中,

在维度层面,采用链式注意力机制来估计每个推理维度的重要性,如下公式所示:

其中,W

其中,每一解码器包括多头自注意力层、多头互注意力层和多头链式注意力层;其中,多头自注意力层用以捕获单词之间的依赖关系,并获取当前解码器的隐藏状态;多头互注意力层与编码器连接,用以获取编码器的编码信息;多头链式注意力层用以获取先前解码器的推理结果信息。

具体地,每个解码器都是基于Chain Transformer模型解码器的,每个解码器包含一堆区块,每个区块由上述三个不同的attention layer(注意力层)组成。例如,在某个解码器中的某个解码步骤处,首先应用多头自注意力层来捕获所生成的字或词的依赖性并获得隐藏状态,并掩码用于确保生成下一个单词的预测仅取决于单词前面的序列。然后多头互注意力层(事件注意力层)和多头链式注意力层,按照如下公式获取来自编码器和先前解码器的信息,

其中,h

再通过一个融合门机制对各注意力层的信息进行融合,计算过程如下:

其中,W

最后通过一个线性层进行激活后,得到产生推理结果的概率,计算方式如下:

P(y

其中,W

当产生的推理结果的概率达到一定预设值时,得到对应的推理结果信息,其中,步骤S3中的产生不同常识维度的推理结果信息的步骤具体包括:

S3.1,建立基于外部常识语料库的定性预训练模型,以对事件的背景常识知识进行自学习。

S3.2,通过自学习后的定性预训练模型对不同常识维度的解码器的解码信息进行逻辑推理,以得到不同常识维度的推理结果信息。

具体地,在训练过程中,首先为了更好地理解和表达事件,学习逻辑链的间接推理,可在三个外部语料库上对定性预训练模型进行预训练,以学习事件的背景常识知识和学习链式推理能力。其中,语料库由五个句子组成。预训练分为两个阶段。首先,我们将前四个句子作为输入事件x,直接推理最后一个句子作为推理目标y。我们使用编码器对前四个句子x进行编码,用一个解码器推理并生成最后一个句子。此外,为了学习间接推理过程,我们将推理过程分解为一个逐句的生成过程。我们使用第一句作为输入事件,用解码器逐个生成最后4句。

在训练阶段,我们将训练好的定性预训练模型在目标任务上进行训练,自学习每个常识维度的常识知识,其中使用编码器对事件进行编码,使用解码器沿着逻辑链依次推理出不同的常识维度。

在推理阶段,使用预训练好的定性预训练模型进行推理。而对于不同的推理结果,我们在第一常识维度推理时进行波束搜索,然后沿着逻辑链,我们可以对后面常识维度的不同推理结果信息进行推理。此外,在逻辑链的指导下,不同常识维度的推理结果信息在逻辑上更加一致。

S4,根据推理结果信息生成对应的文本描述。

本实施例第二方面提出了一种计算机可读存储介质,其上存储有计算机程序,计算机程序在被处理器执行时,实现上述的基于逻辑增强的机器人互动方法。

本实施例第三方面还提出了一种电子设备,包括存储器、处理器以及存储在存储器上的计算机程序,计算机程序被处理器执行时,实现上述的基于逻辑增强的机器人互动方法。

本实施例的基于逻辑增强的机器人互动方法与现有的技术方案不同,现有的技术方案采用的神经模型在每个常识维度上使用波束搜索来产生不同的推理结果,而本发明只在第一个常识维度上使用波束搜索,然后根据事件以及逻辑链上的间接线索来推理其他常识维度。因此,本实施例的基于逻辑增强的机器人互动方法不仅可以产生不同的推理结果信息,而且可以保证不同常识维度的推理结果信息在逻辑上是一致的。

综上所述,本实施例通过多个不同常识维度的解码器对编码信息进行链式逐步解码,并采用定性预训练模型对事件的背景常识进行自学习,以及在不同常识维度的解码器上增加链式注意力模块,使得解码器能够获取最重要的推理结果信息以准确地进行逻辑推理,并能够保证不同常识维度之间逻辑的一致性。

需要说明的是,在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序,然后将其存储在计算机存储器中。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号