首页> 中国专利> 文本事件序列生成方法、装置、设备和存储介质

文本事件序列生成方法、装置、设备和存储介质

摘要

本发明实施例提供一种文本事件序列生成方法、装置、设备和存储介质,属于文本处理技术领域,该方法包括:获取目标文本的第一事件序列;第一事件序列为乱序和/或不完整的事件序列;将目标文本的第一事件序列输入文本事件序列生成模型,得到目标文本的目标事件序列;其中,文本事件序列生成模型是基于样本文本的目标事件序列、样本文本的第一事件序列和目标损失训练得到的;目标损失是基于样本文本的第一事件序列的事件向量和样本文本的预测事件序列的事件向量确定的。本发明实施例的方法从事件序列中的事件语义这个全局角度进行文本事件序列生成模型的训练,使得训练后的文本事件序列生成模型可以基于事件语义准确的进行文本事件序列的生成。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-02-10

    实质审查的生效 IPC(主分类):G06F40/284 专利申请号:2022116439757 申请日:20221220

    实质审查的生效

  • 2023-01-17

    公开

    发明专利申请公布

说明书

技术领域

本发明涉及文本处理技术领域,尤其涉及一种文本事件序列生成方法、装置、设备和存储介质。

背景技术

自然语言处理中需要生成文本的时序事件序列,如对话生成,篇章理解等。文本的时序事件序列生成包括文本事件排序和文本事件填充,文本事件排序指将文本中无序的事件排成有序的事件,事件填充指将文本中缺失的事件补充完整。

相关技术中,文本时序事件序列生成使用一个序列到序列的生成模型来同时处理文本事件排序和文本事件填充,通过最大似然来优化模型的参数。该方法把输入输出看作词序列,只关注文本的时序事件序列中词的语义,导致生成的文本时序事件序列的效果较差。

发明内容

针对现有技术中的问题,本发明实施例提供一种文本事件序列生成方法、装置、设备和存储介质。

具体地,本发明实施例提供了以下技术方案:

第一方面,本发明实施例提供了一种文本事件序列生成方法,包括:

获取目标文本的第一事件序列;所述第一事件序列为乱序和/或不完整的事件序列;

将目标文本的第一事件序列输入文本事件序列生成模型,得到目标文本的目标事件序列;其中,目标事件序列为正序的完整的事件序列;文本事件序列生成模型是基于样本文本的目标事件序列、样本文本的第一事件序列和目标损失训练得到的;样本文本的目标事件序列为样本文本的正序的完整的事件序列;样本文本的第一事件序列为样本文本的乱序和/或不完整的事件序列;目标损失是基于样本文本的第一事件序列的事件向量和样本文本的预测事件序列的事件向量确定的。

进一步地,所述文本事件序列生成模型基于如下方式进行训练:

根据样本文本的目标事件序列,生成样本文本的第一事件序列;

将样本文本的第一事件序列输入初始文本事件序列生成模型,得到所述样本文本的第一事件序列的事件向量和所述样本文本的预测事件序列的事件向量;

将样本文本的第一事件序列的事件向量和样本文本的预测事件序列的事件向量之间的最优传输损失作为目标损失,并基于目标损失对文本事件序列生成模型进行训练。

进一步地,所述将样本文本的第一事件序列输入初始文本事件序列生成模型,得到所述样本文本的第一事件序列的事件向量和所述样本文本的预测事件序列的事件向量,包括:

将所述样本文本的第一事件序列输入初始文本事件序列生成模型,得到所述样本文本的第一事件序列的词向量和所述样本文本的预测事件序列的词向量;

根据所述样本文本的第一事件序列的词向量和所述样本文本的预测事件序列的词向量,得到所述样本文本的第一事件序列的事件向量和所述样本文本的预测事件序列的事件向量。

进一步地,所述根据所述样本文本的第一事件序列的词向量和所述样本文本的预测事件序列的词向量,得到所述样本文本的第一事件序列的事件向量和所述样本文本的预测事件序列的事件向量,包括:

将样本文本的第一事件序列的词向量中各个事件的词向量进行平均,得到样本文本的第一事件序列的事件向量;

将样本文本的预测事件序列的词向量中各个事件的词向量进行平均,得到样本文本的预测事件序列的事件向量。

进一步地,所述基于目标损失对文本事件序列生成模型进行训练,包括:

确定样本文本的目标事件序列和样本文本的预测事件序列之间的交叉熵;

根据目标损失及样本文本的目标事件序列和样本文本的预测事件序列之间的交叉熵,对文本事件序列生成模型进行训练。

进一步地,对所述文本事件序列生成模型进行训练以最小化如下训练目标:

所述x表示样本文本的目标事件序列;所述y表示样本文本的预测事件序列;所述S 表示样本文本的第一事件序列的事件向量;所述

进一步地,根据样本文本的目标事件序列,生成样本文本的第一事件序列,包括:

将样本文本的目标事件序列中的至少一个事件进行打乱和/或删除,生成样本文本的第一事件序列。

第二方面,本发明实施例还提供了一种文本事件序列生成装置,包括:

获取模块,用于获取目标文本的第一事件序列;所述第一事件序列为乱序和/或不完整的事件序列;

生成模块,用于将所述目标文本的第一事件序列输入文本事件序列生成模型,得到目标文本的目标事件序列;其中,所述目标事件序列为正序的完整的事件序列;所述文本事件序列生成模型是基于样本文本的目标事件序列和样本文本的第一事件序列训练得到的;所述样本文本的目标事件序列为样本文本的正序的完整的事件序列;所述样本文本的第一事件序列为样本文本的乱序和/或不完整的事件序列。

第三方面,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所述文本事件序列生成方法。

第四方面,本发明实施例还提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述文本事件序列生成方法。

第五方面,本发明实施例还提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如第一方面所述文本事件序列生成方法。

本发明实施例提供的文本事件序列生成方法、装置、设备和存储介质,通过将目标文本的乱序和/或不完整的事件序列输入文本事件序列生成模型,其中,文本事件序列生成模型是基于样本文本的正序的完整的事件序列、样本文本的乱序和/或不完整的事件序列和目标损失训练得到的,其中,目标损失是基于样本文本的第一事件序列的事件向量和样本文本的预测事件序列的事件向量确定的,从而实现了基于文本的事件序列中的事件语义进行文本事件序列生成模型的训练,即从事件序列中的事件语义这个全局角度进行文本事件序列生成模型的训练,使得训练后的文本事件序列生成模型可以基于文本的事件序列中的事件语义准确的进行文本事件序列的生成。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的文本事件序列生成方法的流程示意图;

图2是本发明实施例提供的文本事件序列生成方法的另一流程示意图;

图3是本发明实施例提供的文本事件序列生成装置的结构示意图;

图4是本发明实施例提供的电子设备的结构示意图。

图标:

710:获取模块;720:生成模块;

810:处理器;820:通信接口;830:存储器;840:通信总线。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例的方法可以应用于文本处理场景中,实现文本事件序列的生成。

相关技术中,文本时序事件序列生成使用一个序列到序列的生成模型来同时处理文本事件排序和文本事件填充,通过最大似然来优化模型的参数。该方法只关注文本的时序事件序列中词的语义,导致生成的文本时序事件序列的效果较差。

本发明实施例的文本事件序列生成方法,通过将目标文本的乱序和/或不完整的事件序列输入文本事件序列生成模型,其中,文本事件序列生成模型是基于样本文本的正序的完整的事件序列、样本文本的乱序和/或不完整的事件序列和目标损失训练得到的,其中,目标损失是基于样本文本的第一事件序列的事件向量和样本文本的预测事件序列的事件向量确定的,从而实现了基于文本的事件序列中的事件语义进行文本事件序列生成模型的训练,即从事件序列中的事件语义这个全局角度进行文本事件序列生成模型的训练,使得训练后的文本事件序列生成模型可以基于文本的事件序列中的事件语义准确的进行文本事件序列的生成。

实施例一

下面结合图1-图4以具体的实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。

图1是本发明实施例提供的文本事件序列生成方法一实施例的流程示意图。如图1所示,本实施例提供的方法,包括:

步骤101、获取目标文本的第一事件序列;第一事件序列为乱序和/或不完整的事件序列。

具体地,文本时序事件序列的生成对自然语言处理任务比较重要,如对话生成,篇章理解等任务。文本的事件排序和事件填充是时序事件序列生成中具有挑战性的任务,文本的事件排序指将无序的事件序列排成有序的事件序列,文本的事件填充指将事件序列中缺失的事件补充完整。现有的文本时序事件序列生成方法使用一个序列到序列的生成模型来同时处理文本事件排序和文本事件填充,通过最大似然来优化模型的参数。该方法把输入输出看作词序列,只关注文本的时序事件序列中词的语义,导致生成的文本时序事件序列的效果较差。

为了解决上述问题,本发明首先获取目标文本的第一事件序列,其中,第一事件序列为乱序和/或不完整的事件序列,也就是要获取需要进行排序和/或填充的文本事件序列。

步骤102、将目标文本的第一事件序列输入文本事件序列生成模型,得到目标文本的目标事件序列。

其中,目标事件序列为正序的完整的事件序列;文本事件序列生成模型是基于样本文本的目标事件序列、样本文本的第一事件序列和目标损失训练得到的;样本文本的目标事件序列为样本文本的正序的完整的事件序列;样本文本的第一事件序列为样本文本的乱序和/或不完整的事件序列;目标损失是基于样本文本的第一事件序列的事件向量和样本文本的预测事件序列的事件向量确定的。

具体地,在获取目标文本的乱序和/或不完整的事件序列后,本发明实施例中将目标文本的乱序和/或不完整的事件序列输入文本事件序列生成模型,得到目标文本的目标事件序列,其中,目标文本的目标事件序列为目标文本的正序的完整的事件序列;也就是通过将目标文本的乱序和/或不完整的事件序列输入文本事件序列生成模型,就可以得到目标文本的正序的完整的事件序列,实现了目标文本的事件序列的排序和填充。其中,文本事件序列生成模型是基于样本文本的正序的完整的事件序列、样本文本的乱序和/或不完整的事件序列和目标损失训练得到的,目标损失是基于样本文本的第一事件序列的事件向量和样本文本的预测事件序列的事件向量确定的,从而实现了基于文本的事件序列中的事件语义进行文本事件序列生成模型的训练,而不是仅仅考虑文本事件序列中词的语义,即从事件序列中的事件语义这个全局角度进行文本事件序列生成模型的训练,使得训练后的文本事件序列生成模型可以基于文本的事件序列中的事件语义准确的进行文本的事件序列的排序和填充,从而也就可以得到完整和正序的文本事件序列,进而根据目标文本的正序的完整的事件序列,实现对话生成,篇章理解等任务。

上述实施例的方法,通过将目标文本的乱序和/或不完整的事件序列输入文本事件序列生成模型,其中,文本事件序列生成模型是基于样本文本的正序的完整的事件序列、样本文本的乱序和/或不完整的事件序列和目标损失训练得到的,其中,目标损失是基于样本文本的第一事件序列的事件向量和样本文本的预测事件序列的事件向量确定的,从而实现了基于文本的事件序列中的事件语义进行文本事件序列生成模型的训练,即从事件序列中的事件语义这个全局角度进行文本事件序列生成模型的训练,使得训练后的文本事件序列生成模型可以基于文本的事件序列中的事件语义准确的进行文本事件序列的生成。

在一实施例中,文本事件序列生成模型基于如下方式进行训练:

根据样本文本的目标事件序列,生成样本文本的第一事件序列;

将样本文本的第一事件序列输入初始文本事件序列生成模型,得到样本文本的第一事件序列的事件向量和样本文本的预测事件序列的事件向量;

将样本文本的第一事件序列的事件向量和样本文本的预测事件序列的事件向量之间的最优传输损失作为目标损失,并基于目标损失对文本事件序列生成模型进行训练。

具体地,文本事件序列生成模型是基于样本文本的正序的完整的事件序列和样本文本的乱序和/或不完整的事件序列训练得到的,从而使得训练后的文本事件序列生成模型可以准确的进行文本的事件序列的排序和填充,得到完整和正序的文本事件序列,实现对话生成、篇章理解等任务。

可选的,文本事件序列生成模型训练过程中,根据样本文本的目标事件序列,生成样本文本的第一事件序列,即将样本文本的正序的完整的事件序列通过打乱和删除生成样本文本的乱序的和/或不完整的事件序列,并将样本文本的乱序的和/或不完整的事件序列输入初始文本事件序列生成模型,得到样本文本的乱序的和/或不完整的事件序列的事件向量和样本文本的预测的正序的完整的事件序列的事件向量,也就是得到了样本文本的乱序的和/或不完整的事件序列的事件表示向量和样本文本的预测的正序的完整的事件序列的事件表示向量;进而根据样本文本的乱序的和/或不完整的事件序列的事件向量和样本文本的预测的正序的完整的事件序列的事件向量之间的最优传输损失,对文本事件序列生成模型进行训练,实现了基于文本的事件序列中的事件语义进行文本事件序列的生成,而不是仅仅考虑文本事件序列中词的语义,即从事件序列中的事件语义这个全局角度进行文本事件序列的生成,使得训练后的文本事件序列生成模型可以基于文本的事件序列中的事件语义准确的进行文本事件序列的生成。

上述实施例的方法,通过将样本文本的正序的完整的事件序列和样本文本的乱序的和/或不完整的事件序列输入初始文本事件序列生成模型,得到样本文本的乱序的和/或不完整的事件序列的事件表示向量和样本文本的预测的正序的完整的事件序列的事件表示向量,进而根据样本文本的乱序的和/或不完整的事件序列的事件向量和样本文本的预测的正序的完整的事件序列的事件向量之间的最优传输损失,对文本事件序列生成模型进行训练,实现了基于文本的事件序列中的事件语义进行文本事件序列的生成,也就是从事件序列中的事件语义这个全局角度进行文本事件序列的生成,使得训练后的文本事件序列生成模型可以基于文本的事件序列中的事件语义准确的进行文本事件序列的生成。

在一实施例中,将样本文本的第一事件序列输入初始文本事件序列生成模型,得到样本文本的第一事件序列的事件向量和样本文本的预测事件序列的事件向量,包括:

将样本文本的第一事件序列输入初始文本事件序列生成模型,得到样本文本的第一事件序列的词向量和样本文本的预测事件序列的词向量;

根据样本文本的第一事件序列的词向量和样本文本的预测事件序列的词向量,得到样本文本的第一事件序列的事件向量和样本文本的预测事件序列的事件向量。

具体地,将样本文本的第一事件序列输入初始文本事件序列生成模型,也就是将样本文本的乱序的和/或不完整的事件序列输入初始文本事件序列生成模型,得到样本文本的乱序的和/或不完整的事件序列的词向量及样本文本的预测的正序的完整的事件序列的词向量;进而根据样本文本的乱序的和/或不完整的事件序列的词向量及样本文本的预测的正序的完整的事件序列的词向量,得到样本文本的乱序的和/或不完整的事件序列的事件表示向量和样本文本的预测的正序的完整的事件序列的事件表示向量,从而也就实现了基于文本的事件序列中的事件语义进行文本事件序列生成模型的训练和文本事件序列的生成,实现了基于事件序列中的事件语义这个全局角度进行文本事件序列生成模型的训练和文本事件序列的生成,使得训练后的文本事件序列生成模型可以基于文本的事件序列中的事件语义准确的进行文本事件序列的生成。

上述实施例的方法,通过将样本文本的乱序的和/或不完整的事件序列输入初始文本事件序列生成模型,得到样本文本的乱序的和/或不完整的事件序列的词向量及样本文本的预测的正序的完整的事件序列的词向量;进而根据样本文本的乱序的和/或不完整的事件序列的词向量及样本文本的预测的正序的完整的事件序列的词向量,得到样本文本的乱序的和/或不完整的事件序列的事件表示向量和样本文本的预测的正序的完整的事件序列的事件表示向量,从而也就实现了基于事件序列中的事件语义这个全局角度进行文本事件序列生成模型的训练和文本事件序列的生成,使得训练后的文本事件序列生成模型可以基于文本的事件序列中的事件语义准确的进行文本事件序列的生成。

在一实施例中,根据样本文本的第一事件序列的词向量和样本文本的预测事件序列的词向量,得到样本文本的第一事件序列的事件向量和样本文本的预测事件序列的事件向量,包括:

将样本文本的第一事件序列的词向量中各个事件的词向量进行平均,得到样本文本的第一事件序列的事件向量;

将样本文本的预测事件序列的词向量中各个事件的词向量进行平均,得到样本文本的预测事件序列的事件向量。

具体地,本发明实施例中通过将样本文本的乱序的和/或不完整的事件序列的词向量中各个事件的词向量进行平均,得到样本文本的乱序的和/或不完整的事件序列的事件向量,从而也就可以基于事件序列中的事件语义这个全局角度进行文本事件序列中事件的表示,进而也就可以从事件序列中的事件语义这个全局角度进行文本事件序列生成模型的训练和文本事件序列的生成,使得训练后的文本事件序列生成模型可以基于文本的事件序列中的事件语义准确的进行文本事件序列的生成。

上述实施例的方法,通过将样本文本的事件序列的词向量中各个事件的词向量进行平均,得到样本文本的事件序列的事件向量,从而也就可以基于事件序列中的事件语义这个全局角度进行文本事件序列中事件的表示,进而也就可以从事件序列中的事件语义这个全局角度进行文本事件序列生成模型的训练和文本事件序列的生成,使得训练后的文本事件序列生成模型可以基于文本的事件序列中的事件语义准确的进行文本事件序列的生成。

在一实施例中,基于目标损失对文本事件序列生成模型进行训练,包括:

确定样本文本的目标事件序列和样本文本的预测事件序列之间的交叉熵;

根据目标损失及样本文本的目标事件序列和样本文本的预测事件序列之间的交叉熵,对文本事件序列生成模型进行训练。

具体地,本发明实施例基于样本文本的乱序的和/或不完整的事件序列的事件向量和样本文本的预测的正序的完整的事件序列的事件向量之间的最优传输损失,及样本文本的正序的完整的事件序列和样本文本的预测的正序的完整的事件序列之间的交叉熵,对文本事件序列生成模型进行训练,实现了基于文本的事件序列中的事件语义进行文本事件序列的生成,而不是仅仅考虑文本事件序列中词的语义,即从事件序列中的事件语义这个全局角度进行文本事件序列的生成,使得训练后的文本事件序列生成模型可以基于文本的事件序列中的事件语义准确的进行文本事件序列的生成。

上述实施例的方法,基于样本文本的乱序的和/或不完整的事件序列的事件向量和样本文本的预测的正序的完整的事件序列的事件向量之间的最优传输损失,及样本文本的正序的完整的事件序列和样本文本的预测的正序的完整的事件序列之间的交叉熵,对文本事件序列生成模型进行训练,实现了基于事件序列中的事件语义这个全局角度进行文本事件序列生成模型的训练和文本事件序列的生成,使得训练后的文本事件序列生成模型可以基于文本的事件序列中的事件语义准确的进行文本事件序列的生成。

在一实施例中,对文本事件序列生成模型进行训练以最小化如下训练目标:

x表示样本文本的目标事件序列;y表示样本文本的预测事件序列;S表示样本文本 的第一事件序列的事件向量;

具体地,本发明实施例在确定样本文本的乱序的和/或不完整的事件序列的事件向量和样本文本的预测的正序的完整的事件序列的事件向量之间的最优传输损失,及样本文本的正序的完整的事件序列和样本文本的预测的正序的完整的事件序列之间的交叉熵之后,对文本事件序列生成模型进行训练以最小化如下训练目标:

其中,x表示样本文本的目标事件序列;y表示样本文本的预测事件序列;S表示样 本文本的乱序的和/或不完整的事件序列的事件向量;

在一实施例中,根据样本文本的目标事件序列,生成样本文本的第一事件序列,包括:

将样本文本的目标事件序列中的至少一个事件进行打乱和/或删除,生成样本文本的第一事件序列。

具体地,本发明实施例中对文本事件序列生成模型进行训练过程中,首先需要根据样本文本的目标事件序列,生成样本文本的第一事件序列;可选地,将正序的完整的事件序列(样本文本的目标事件序列)通过打乱和/或删除变为乱序的不完整的事件序列(样本文本的第一事件序列),进而根据正序的完整的事件序列、乱序的不完整的事件序列就可以对文本事件序列生成模型进行训练。

可选地,对于正序的完整的事件序列,也可以首先将其中的事件随机打乱顺序,然后对于打乱顺序的事件序列,以一定概率随机删除每个事件,最后将得到的乱序的不完整的事件序列,进而就可以根据正序的完整的事件序列、乱序的不完整的事件序列就可以对文本事件序列生成模型进行训练。

例如,假设样本文本的正序的完整的事件序列为(e1,e2,e3,e4),将其随机打乱后得到的样本文本的乱序的事件序列为(e4,e2,e1,e3),然后就可以得到样本文本的乱序的不完整的事件序列为(e4,e1,e3)。

上述实施例的方法,通过将样本文本的目标事件序列中的至少一个事件进行打乱和/或删除,生成样本文本的第一事件序列,从而也就方便快捷的得到了丰富的训练数据,进而基于丰富的训练数据也就可以实现对文本事件序列生成模型的充分训练,使得训练后的文本事件序列生成模型可以准确地对样本文本进行事件填充和排序。

示例性的,本发明实施例中提供的文本事件序列生成模型的训练方法如图2所示:

(1)形成训练数据,将正序的完整的事件序列通过打乱和删除变为乱序的不完整的事件序列,分别作为输出与输入;

假设样本文本的正序的完整的事件序列为(e1,e2,e3,e4),将其随机打乱后得到的样本文本的乱序的事件序列为(e4,e2,e1,e3),然后得到样本文本的乱序的不完整的事件序列为(e4,e1,e3),将x=(e4,e1,e3)作为训练数据中的输入,y=(e1,e2,e3,e4)作为训练数据中模型的标准输出和监督数据;

(2)抽取输入事件序列和输出事件序列的词表示向量;

将x、y看成样本文本的词的序列,分别输入到BART的编码器和解码器中,然后从BART编码器的输出和解码器的输出端获取对应于样本文本的单词的表示向量;

(3)通过输入事件序列和输出事件序列的词表示向量抽取输入事件序列和输出事件序列的表示向量;

将样本文本中属于同一个事件的单词表示向量平均,得到输入输出的样本文本的事件序列的事件表示向量序列,分别为S=(u1,u2,u3),S’=(v1,v2,v3,v4);

(4)利用最优传输匹配输入输出事件的表示向量,得到事件最优传输损失;

将得到的输入输出的样本文本的事件序列的事件表示向量序列输入到IPOT算法中,得到事件最优传输的损失LEOT;

(5)最小化最优传输损失和交叉熵损失之和,更新模型从而进行文本事件序列生成模型模型的训练;

将输入x和标准输出看成词序列,最小化如下总的损失:

其中,

其中wt表示y中的第t个词,从而实现了基于事件序列中的事件语义这个全局角度进行文本事件序列生成模型的训练和文本事件序列的生成,使得训练后的文本事件序列生成模型可以基于文本的事件序列中的事件语义准确的进行文本事件序列的生成。

上述实施例的方法,基于样本文本的乱序的和/或不完整的事件序列的事件向量和样本文本的预测的正序的完整的事件序列的事件向量之间的最优传输损失,及样本文本的正序的完整的事件序列和样本文本的预测的正序的完整的事件序列之间的交叉熵,对文本事件序列生成模型进行训练以最小化训练目标,从而实现了基于事件序列中的事件语义这个全局角度进行文本事件序列生成模型的训练和文本事件序列的生成,使得训练后的文本事件序列生成模型可以基于文本的事件序列中的事件语义准确的进行文本事件序列的生成。

示例性的,为了验证本发明实施例中提供的文本事件序列的生成方法的有效性和准确性,通过如下实验来验证本方法的性能:

测试语料:

训练数据为EventsNarratives数据集,经过抽取后得到200000条事件序列。测试数据为CaTeRS和MCTaco数据集,经过抽取后分别得到1684和585条事件序列。

测试结果:

通过对比已有方法和本方法的效果来说明其有效性。结果如表1所示:

表1

上表是本发明实施例中提出的事件最优传输EOT在事件排序任务上的两个数据集CaTeRS和MCTaco上的表现,本发明实施例中提出的EOT方法超过之前的方法,说明了本发明实施例中提出的方法的有效性。

如表2是本发明实施例中提出的事件最优传输EOT在事件填充任务上的性能,本发明实施例中提出的EOT方法性能也超过了之前的方法,进一步证明了本发明实施例中提出的文本事件序列的生成方法在时序事件序列生成上的有效性。

表2

下面对本发明提供的文本事件序列生成装置进行描述,下文描述的文本事件序列生成装置与上文描述的文本事件序列生成方法可相互对应参照。

实施例二

图3是本发明提供的文本事件序列生成装置的结构示意图。本实施例提供的文本事件序列生成装置,包括:

获取模块710,用于获取目标文本的第一事件序列;第一事件序列为乱序和/或不完整的事件序列;

生成模块720,用于将目标文本的第一事件序列输入文本事件序列生成模型,得到目标文本的目标事件序列;其中,目标事件序列为正序的完整的事件序列;文本事件序列生成模型是基于样本文本的目标事件序列、样本文本的第一事件序列和目标损失训练得到的;样本文本的目标事件序列为样本文本的正序的完整的事件序列;样本文本的第一事件序列为样本文本的乱序和/或不完整的事件序列;目标损失是基于样本文本的第一事件序列的事件向量和样本文本的预测事件序列的事件向量确定的。

可选地,文本事件序列生成模型基于如下方式进行训练:

根据样本文本的目标事件序列,生成样本文本的第一事件序列;

将样本文本的第一事件序列输入初始文本事件序列生成模型,得到样本文本的第一事件序列的事件向量和样本文本的预测事件序列的事件向量;

将样本文本的第一事件序列的事件向量和样本文本的预测事件序列的事件向量之间的最优传输损失作为目标损失,并基于目标损失对文本事件序列生成模型进行训练。

可选地,所述生成模块720,具体用于:将样本文本的第一事件序列输入初始文本事件序列生成模型,得到样本文本的第一事件序列的词向量和样本文本的预测事件序列的词向量;

根据样本文本的第一事件序列的词向量和样本文本的预测事件序列的词向量,得到样本文本的第一事件序列的事件向量和样本文本的预测事件序列的事件向量。

可选地,所述生成模块720,具体用于:将样本文本的第一事件序列的词向量中各个事件的词向量进行平均,得到样本文本的第一事件序列的事件向量;

将样本文本的预测事件序列的词向量中各个事件的词向量进行平均,得到样本文本的预测事件序列的事件向量。

可选地,所述生成模块720,具体用于:确定样本文本的目标事件序列和样本文本的预测事件序列之间的交叉熵;

根据目标损失及样本文本的目标事件序列和样本文本的预测事件序列之间的交叉熵,对文本事件序列生成模型进行训练。

可选地,所述生成模块720,具体用于:对文本事件序列生成模型进行训练以最小化如下训练目标:

x表示样本文本的目标事件序列;y表示样本文本的预测事件序列;S表示样本文本 的第一事件序列的事件向量;

可选地,生成模块720,用于将样本文本的目标事件序列中的至少一个事件进行打乱和/或删除,生成样本文本的第一事件序列。

本发明实施例的装置,其用于执行前述任一方法实施例中的方法,其实现原理和技术效果类似,此次不再赘述。

实施例三

图4示例了一种电子设备的实体结构示意图,该电子设备可以包括:处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行文本事件序列生成方法,该方法包括:获取目标文本的第一事件序列;第一事件序列为乱序和/或不完整的事件序列;将目标文本的第一事件序列输入文本事件序列生成模型,得到目标文本的目标事件序列;目标事件序列为正序的完整的事件序列;文本事件序列生成模型是基于样本文本的目标事件序列和样本文本的第一事件序列训练得到的;样本文本的目标事件序列为样本文本的正序的完整的事件序列;样本文本的第一事件序列为样本文本的乱序和/或不完整的事件序列。

此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

实施例四

另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的文本事件序列生成方法,该方法包括:获取目标文本的第一事件序列;第一事件序列为乱序和/或不完整的事件序列;将目标文本的第一事件序列输入文本事件序列生成模型,得到目标文本的目标事件序列;目标事件序列为正序的完整的事件序列;文本事件序列生成模型是基于样本文本的目标事件序列和样本文本的第一事件序列训练得到的;样本文本的目标事件序列为样本文本的正序的完整的事件序列;样本文本的第一事件序列为样本文本的乱序和/或不完整的事件序列。

又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的文本事件序列生成方法,该方法包括:获取目标文本的第一事件序列;第一事件序列为乱序和/或不完整的事件序列;将目标文本的第一事件序列输入文本事件序列生成模型,得到目标文本的目标事件序列;目标事件序列为正序的完整的事件序列;文本事件序列生成模型是基于样本文本的目标事件序列和样本文本的第一事件序列训练得到的;样本文本的目标事件序列为样本文本的正序的完整的事件序列;样本文本的第一事件序列为样本文本的乱序和/或不完整的事件序列。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号