首页> 中国专利> 基于文档级情感倾向的情感分类方法、装置、设备及介质

基于文档级情感倾向的情感分类方法、装置、设备及介质

摘要

本申请涉及人工智能技术领域,揭示了一种基于文档级情感倾向的情感分类方法、装置、设备及介质,其中方法包括:对目标评价文本确定句子集合;从句子集合中提取得到与评价对象对应的目标实体属性对;根据目标疑问句模板和目标实体属性对确定目标疑问句;将句子集合中的每个句子分别与目标疑问句拼接得到目标句子对集合;将目标实体属性对和目标句子对集合输入情感分类模型进行情感分类概率预测得到情感分类概率向量,情感分类模型是基于注意力机制、内部方面一致性和方面倾向性联合得到的模型;根据情感分类概率向量得到目标情感分类。采用注意力机制、内部方面一致性和方面倾向性联合建模得到的模型进行情感分类概率预测,提高情感分析的准确性。

著录项

  • 公开/公告号CN113849651A

    专利类型发明专利

  • 公开/公告日2021-12-28

    原文格式PDF

  • 申请/专利权人 平安科技(深圳)有限公司;

    申请/专利号CN202111158076.3

  • 发明设计人 于凤英;王健宗;

    申请日2021-09-28

  • 分类号G06F16/35(20190101);G06F40/211(20200101);G06K9/62(20060101);

  • 代理机构44343 深圳市明日今典知识产权代理事务所(普通合伙);

  • 代理人王杰辉

  • 地址 518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼

  • 入库时间 2023-06-19 13:26:15

说明书

技术领域

本申请涉及到人工智能技术领域,特别是涉及到一种基于文档级情感倾向的情感分类方法、装置、设备及介质。

背景技术

现有基于评价内容的情感分析,总是将方面级情感分类看作是一个独立的逐方面的句子级分类问题,很大程度上忽略了文档级情感偏好信息,导致方面级情感分类信息缺失。而实际上,评价内容中的句子都不是单独出现,而是几句含义较为集中、情感较为一致的句子共同出现,而且评价内容场合下的句子构成往往较随意,有时句子本身无法提供足够的信息,必须参考其他句子的内容甚至情感倾向才能理解本句的情感,将方面级情感分类看作是一个独立的逐方面的句子级分类问题降低了情感分析的准确性。

发明内容

本申请的主要目的为提供一种基于文档级情感倾向的情感分类方法、装置、设备及介质,旨在解决现有技术的基于评价内容的情感分析,将方面级情感分类看作是一个独立的逐方面的句子级分类问题,忽略了文档级情感偏好信息,导致方面级情感分类信息缺失,降低了情感分析的准确性的技术问题。

为了实现上述发明目的,本申请提出一种基于文档级情感倾向的情感分类方法,所述方法包括:

获取目标评价文本和方面情感提取规则,其中,所述方面情感提取规则包括评价对象和评价方向;

对所述目标评价文本进行句子提取,得到句子集合;

从所述句子集合中提取得到与所述评价对象对应的目标实体属性对;

获取与所述评价方向对应的目标疑问句模板,根据所述目标疑问句模板和所述目标实体属性对进行疑问句构造,得到目标疑问句;

将所述句子集合中的每个句子分别与所述目标疑问句进行拼接,得到目标句子对集合;

将所述目标实体属性对和所述目标句子对集合输入情感分类模型进行情感分类概率预测,得到情感分类概率向量,其中,所述情感分类模型是基于注意力机制、内部方面一致性和方面倾向性联合建模得到的模型;

根据所述情感分类概率向量进行情感分类确定,得到目标情感分类。

本申请还提出了一种基于文档级情感倾向的情感分类装置,所述装置包括:

数据获取模块,用于获取目标评价文本和方面情感提取规则,其中,所述方面情感提取规则包括评价对象和评价方向;

句子集合确定模块,用于对所述目标评价文本进行句子提取,得到句子集合;

目标实体属性对确定模块,用于从所述句子集合中提取得到与所述评价对象对应的目标实体属性对;

目标疑问句确定模块,用于获取与所述评价方向对应的目标疑问句模板,根据所述目标疑问句模板和所述目标实体属性对进行疑问句构造,得到目标疑问句;

目标句子对集合确定模块,用于将所述句子集合中的每个句子分别与所述目标疑问句进行拼接,得到目标句子对集合;

情感分类概率向量确定模块,用于将所述目标实体属性对和所述目标句子对集合输入情感分类模型进行情感分类概率预测,得到情感分类概率向量,其中,所述情感分类模型是基于注意力机制、内部方面一致性和方面倾向性联合建模得到的模型;

目标情感分类确定模块,用于根据所述情感分类概率向量进行情感分类确定,得到目标情感分类。

本申请还提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。

本申请还提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。

本申请的基于文档级情感倾向的情感分类方法、装置、设备及介质,其中方法通过首先对所述目标评价文本进行句子提取,得到句子集合,从所述句子集合中提取得到与所述评价对象对应的目标实体属性对,获取与所述评价方向对应的目标疑问句模板,根据所述目标疑问句模板和所述目标实体属性对进行疑问句构造,得到目标疑问句,将所述句子集合中的每个句子分别与所述目标疑问句进行拼接,得到目标句子对集合,然后将所述目标实体属性对和所述目标句子对集合输入情感分类模型进行情感分类概率预测,得到情感分类概率向量,其中,所述情感分类模型是基于注意力机制、内部方面一致性和方面倾向性联合建模得到的模型,最后根据所述情感分类概率向量进行情感分类确定,得到目标情感分类,实现了采用基于注意力机制、内部方面一致性和方面倾向性联合建模得到的模型进行情感分类概率预测,利用注意力机制学习方面相关句子表征以提高预测的准确性,利用内部方面一致性通过其他句子给出正确的判断,以及利用方面倾向性可以在隐晦而难以判断的文本中通过整体的情感判断给出对象的情感,从而提高了情感分析的准确性。

附图说明

图1为本申请一实施例的基于文档级情感倾向的情感分类方法的流程示意图;

图2为本申请一实施例的基于文档级情感倾向的情感分类装置的结构示意框图;

图3为本申请一实施例的计算机设备的结构示意框图。

本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

参照图1,本申请实施例中提供一种基于文档级情感倾向的情感分类方法,方法包括:

S1:获取目标评价文本和方面情感提取规则,其中,方面情感提取规则包括评价对象和评价方向;

S2:对目标评价文本进行句子提取,得到句子集合;

S3:从句子集合中提取得到与评价对象对应的目标实体属性对;

S4:获取与评价方向对应的目标疑问句模板,根据目标疑问句模板和目标实体属性对进行疑问句构造,得到目标疑问句;

S5:将句子集合中的每个句子分别与目标疑问句进行拼接,得到目标句子对集合;

S6:将目标实体属性对和目标句子对集合输入情感分类模型进行情感分类概率预测,得到情感分类概率向量,其中,情感分类模型是基于注意力机制、内部方面一致性和方面倾向性联合建模得到的模型;

S7:根据情感分类概率向量进行情感分类确定,得到目标情感分类。

本实施例通过首先对目标评价文本进行句子提取,得到句子集合,从句子集合中提取得到与评价对象对应的目标实体属性对,获取与评价方向对应的目标疑问句模板,根据目标疑问句模板和目标实体属性对进行疑问句构造,得到目标疑问句,将句子集合中的每个句子分别与目标疑问句进行拼接,得到目标句子对集合,然后将目标实体属性对和目标句子对集合输入情感分类模型进行情感分类概率预测,得到情感分类概率向量,其中,情感分类模型是基于注意力机制、内部方面一致性和方面倾向性联合建模得到的模型,最后根据情感分类概率向量进行情感分类确定,得到目标情感分类,实现了采用基于注意力机制、内部方面一致性和方面倾向性联合建模得到的模型进行情感分类概率预测,利用注意力机制学习方面相关句子表征以提高预测的准确性,利用内部方面一致性通过其他句子给出正确的判断,以及利用方面倾向性可以在隐晦而难以判断的文本中通过整体的情感判断给出对象的情感,从而提高了情感分析的准确性。

对于S1,可以获取用户输入的目标评价文本,也可以从数据库中获取目标评价文本,还可以从第三方应用系统中获取目标评价文本。

目标评价文本,也就是需要进行情感分类的一个评价文本。评价文本包括但不限于:医疗服务评价内容、商品购买评价内容、保险购买评价内容。

可以理解的是,评价文本是一个评价人对一个评价对象的一次评价的文本。

评价对象包括:实体。

方面情感提取规则,也就是对目标评价文本进行情感分类时的方面情感的提取规则。方面情感提取规则包括:评价对象和评价方向。比如,当目标评价文本是医疗服务评价内容时,方面情感提取规则是提取医生(也就是评价对象)的擅长治疗疾病领域也就是(评价方向)作为方面情感,在此举例不做具体限定。

对于S2,对目标评价文本进行句子提取,将提取的所有句子作为句子集合。

对目标评价文本进行句子提取的方法在此不做赘述。

对于S3,根据方面情感提取规则中的评价对象,从句子集合中进行实体的提取作为目标实体,然后从句子集合中提取与目标实体对应的属性作为目标属性;采用预设的拼接格式,对目标实体和目标属性进行实体属性对拼接,将拼接得到的数据作为目标实体属性对。

也就是说,本申请的方面包括实体和属性。

可以理解的是,目标实体属性对的拼接格式为:

[CLS]e

其中,e

比如,实体是“A保险”,属性是“公司”,目标实体属性对为:[CLS]A保险[SEP]公司[SEP],在此举例不做具体限定。

可以理解的是,句子集合中包括多个实体及属性,从句子集合中提取得到与评价对象对应的目标实体属性对,只将与评价对象对应的实体和属性进行拼接。句子集合中的句子可以包括实体及属性,也可以不包括实体及属性。

具体地,从句子集合中提取得到与评价对象对应的目标实体属性对的步骤,根据评价对象,从知识图谱中进行分类查找,将查找的分类对应的各个实体作为参考实体集,对句子集合中进行实体识别,得到候选实体集合,从候选实体集中获取参考实体集对应的实体,将获取的每个实体作为目标实体。

对于S4,可以从数据库中获取与方面情感提取规则中的评价方向对应的目标疑问句模板,还可以从第三方应用系统中获取与评价方向对应的目标疑问句模板。

其中,将方面情感提取规则中的评价方向在数据库中进行查找,将查找到的评价方向对应的疑问句模板作为目标疑问句模板。

比如,评价方向为服务态度,目标疑问句模板为:你觉得【实体替换位】和【属性替换位】的服务态度怎么样,在此举例不做具体限定。

其中,根据目标实体属性对中的实体对目标疑问句模板中的实体替换位进行替换,根据目标实体属性对中的属性对目标疑问句模板中的属性替换位进行替换,将替换后的目标疑问句模板作为目标疑问句。

比如,目标实体属性对中的目标实体是“张三”,目标实体属性对中的目标属性是“医生”,目标疑问句模板为:你觉得【实体替换位】和【属性替换位】的服务态度怎么样,则根据目标疑问句模板和目标实体属性对进行疑问句构造得到目标疑问句为“你觉得张三和医生的服务态度怎么样”,在此举例不做具体限定。

对于S5,采用预设的句子拼接规则,将目标疑问句和句子集合中的每个句子分别进行拼接,将拼接得到的各个句子作为目标句子对集合。

可以理解的是,目标句子对集合中的目标句子对的拼接格式为:

[CLS]s

其中,s

也就是说,句子集合中的句子与目标句子对集合中的目标句子对一一对应。

对于S6,将目标实体属性对和目标句子对集合输入情感分类模型首先进行编码,其次结合注意力机制进行内部方面一致性的编码、结合注意力机制进行方面倾向性的编码,然后将两种编码进行句子融合,最后根据句子融合的结果进行情感分类概率预测,从而实现了采用基于注意力机制、内部方面一致性和方面倾向性联合建模得到的模型,针对目标评价文本中的方面情感提取规则进行情感分类概率预测,将情感分类概率预测得到的向量作为情感分类概率向量。

对于S7,从情感分类概率向量中找出最大概率,将找出的最大概率对应的情感分类确定为目标情感分类。

目标情感分类,是目标评价文本针对方面情感提取规则的情感分类。

可选的,根据情感分类概率向量进行情感分类确定,得到目标情感分类的步骤,包括:从情感分类概率向量中找出最大概率,将找出的最大概率作为候选概率;获取预设概率阈值,当候选概率大于或等于预设概率阈值时,将候选概率作为目标概率;将目标概率对应的情感分类确定为目标情感分类。从而避免将过低的概率对应的情感分类确定为目标情感分类,提高了确定的目标情感分类的准确性。

情感分类,是对带有感情色彩的主观性文本进行分析、推理的过程,即分析对说话人的态度,倾向正面,还是反面。

在一个实施例中,上述将目标实体属性对和目标句子对集合输入情感分类模型进行情感分类概率预测,得到情感分类概率向量的步骤之前,还包括:

S61:获取多个训练样本,每个训练样本包括:实体属性对样本、句子对样本集合和情感分类概率标定值;

S62:将多个训练样本中的一个训练样本作为待训练的训练样本;

S63:将待训练的训练样本的实体属性对样本输入初始模型的编码层进行编码,得到方向编码向量;

S64:将待训练的训练样本的句子对样本集合中的每个句子对样本分别输入编码层进行编码,得到句子编码向量集合;

S65:采用初始模型的内部方面一致性编码层,根据方向编码向量对句子编码向量集合中的句子编码向量分别进行句子顶点与句子顶点之间的注意力权重计算及编码,得到第一句子向量集合;

S66:采用初始模型的方面倾向性编码层,根据句子编码向量集合分别中的句子编码向量分别进行句子顶点与句子顶点之间的注意力权重计算及编码,得到第二句子向量集合;

S67:采用初始模型的句子融合层,根据第一句子向量集合和第二句子向量集合进行特征提取及特征融合,得到目标句子向量集合;

S68:采用初始模型的情感分类层,根据目标句子向量集合中的每个目标句子向量分别进行情感分类概率预测,得到情感分类概率预测值;

S69:根据待训练的训练样本的情感分类概率标定值和情感分类概率预测值对初始模型进行训练;

S610:重复执行将多个训练样本中的一个训练样本作为待训练的训练样本的步骤,直至达到预设模型训练结束条件,将达到预设模型训练结束条件的初始模型确定为情感分类模型。

本实施例基于注意力机制、内部方面一致性编码和方面倾向性编码联合建模得到的情感分类模型,从而利用注意力机制学习方面相关句子表征以提高预测的准确性,利用内部方面一致性通过其他句子给出正确的判断,以及利用方面倾向性可以在隐晦而难以判断的文本中通过整体的情感判断给出对象的情感,提高了情感分类模型进行情感分类概率预测的准确性。

对于S61,可以获取用户输入的多个训练样本,也可以从数据库中获取多个训练样本,还可以从第三方应用系统中获取多个训练样本。

实体属性对样本的拼接格式为:

[CLS]e

句子对样本集合中每个句子对样本的拼接格式为:

[CLS]s

在同一个训练样本中,实体属性对样本、句子对样本集合是从同一个评价文本得到的数据,情感分类概率标定值是对实体属性对样本和句子对样本集合的情感分类标定的正确结果。

句子对样本集合,是根据一个评价文本中的所有句子的集合得到的数据。

对于S62,从多个训练样本中获取一个训练样本,将获取的训练样本作为待训练的训练样本。

对于S63,初始模型的编码层是基于BERT(Bidirectional EncoderRepresentations from Transformers)模型得到的编码层。

将待训练的训练样本的实体属性对样本输入初始模型的编码层进行编码,获取标志位[CLS]在编码层中对应的输出向量作为方向编码向量。

对于S64,将待训练的训练样本的句子对样本集合中的每个句子对样本分别输入编码层进行编码,获取标志位[CLS]在编码层中对应的各个输出向量作为句子编码向量集合。

其中,句子编码向量集合中的句子编码向量与待训练的训练样本的句子对样本集合中的句子对样本一一对应。

对于S65,采用初始模型的内部方面一致性编码层,首先将句子编码向量集合中的方面(也就是评价对象)与方向编码向量相同的句子编码向量作为句子顶点,然后句子顶点与方向编码向量对应的方面的注意力权重计算,根据计算得到的注意力权重对句子编码向量集合中的每个句子编码向量进行编码,将编码得到的每个向量作为一个第一句子向量,将所有第一句子向量作为第一句子向量集合。

也就是说,第一句子向量集合中的第一句子向量与句子编码向量集合中的句子编码向量一一对应。

可以理解的是,句子顶点表述为句子编码向量。

对于S66,采用初始模型的方面倾向性编码层,根据方向编码向量和句子编码向量集合分别进行句子顶点与句子顶点之间的注意力权重计算,根据计算得到的注意力权重对句子编码向量集合中的每个句子编码向量进行编码,将编码得到的每个向量作为一个第二句子向量,将所有第二句子向量作为第二句子向量集合。

也就是说,第二句子向量集合中的第二句子向量与句子编码向量集合中的句子编码向量一一对应。

对于S67,采用初始模型的句子融合层,根据第一句子向量集合和第二句子向量集合先进行每个句子对样本对应的句子向量拼接,然后对拼接得到的每个向量进行特征提取及特征融合,将特征融合得到的每个向量作为一个目标句子向量,将所有目标句子向量作为目标句子向量集合。

也就是说,目标句子向量集合中的目标句子向量与句子编码向量集合中的句子编码向量一一对应。

对于S68,采用初始模型的情感分类层,根据目标句子向量集合中的每个目标句子向量分别进行情感分类概率预测,将情感分类概率预测得到的数据作为情感分类概率预测值。

情感分类层采用softmax回归分类器。softmax回归分类器是采用softmax函数(归一化指数函数)的分类器。

对于S69,根据待训练的训练样本的情感分类概率标定值和情感分类概率预测值对初始模型进行训练。

对于S610,重复执行步骤S62至步骤S610,直至达到预设模型训练结束条件,达到预设模型训练结束条件的初始模型是符合预期目标的模型,因此可以将达到预设模型训练结束条件的初始模型确定为情感分类模型。

预设模型训练结束条件是初始模型的损失值达到第一收敛条件或迭代次数达到第二收敛条件。

第一收敛条件是指相邻两次计算的初始模型的损失值的大小满足lipschitz条件(利普希茨连续条件)。

迭代次数是指初始模型被训练的次数,也就是说,被训练一次,迭代次数增加1。

第二收敛条件是一个具体数值。

在一个实施例中,上述采用初始模型的内部方面一致性编码层,根据方向编码向量和句子编码向量集合分别进行句子编码向量的内部方面一致性编码,得到第一句子向量集合的步骤,包括:

S651:采用内部方面一致性编码层,根据方向编码向量,对句子编码向量集合进行句子顶点确定,得到句子顶点集合;

S652:采用内部方面一致性编码层,根据方向编码向量和句子顶点集合进行句子顶点与方面的一致性图构建,得到目标方面一致性图;

S653:采用内部方面一致性编码层,根据目标方面一致性图进行句子顶点与方面之间的注意力权重计算,得到第一注意力权重集合;

S654:采用内部方面一致性编码层,根据第一注意力权重集合和句子顶点集合分别进行每个句子顶点的编码,得到第一句子向量集合。

本实施例首先采用初始模型的内部方面一致性编码层,根据方向编码向量和句子编码向量集合先进行句子顶点确定,其次进行句子顶点与方面的一致性图构建,然后进行句子顶点与方面之间的注意力权重计算,最后进行每个句子顶点的编码,利用注意力机制学习方面相关句子表征以提高预测的准确性,利用内部方面一致性通过其他句子给出正确的判断,提高了情感分类模型进行情感分类概率预测的准确性。

对于S651,内部方面一致性的内部是指在同一个评价文本。

内部方面一致性,是指同一个评价文本中的句子顶点共享一个方面顶点,则认为这些句子顶点在这个方面顶点具有相同的情绪。

可以理解的是,方面顶点表述为方向编码向量。

其中,采用内部方面一致性编码层,从句子编码向量集合中找出方面与方向编码向量相同的句子编码向量,将找出的每个句子编码向量作为一个句子顶点,将所有句子顶点作为句子顶点集合。

也就是说,句子顶点集合在的句子顶点共享方向编码向量对应的方面。

对于S652,采用内部方面一致性编码层,根据方向编码向量和句子顶点集合进行句子顶点与方面的一致性图构建,将构建得到的方面一致性图作为目标方面一致性图。

其中,将方向编码向量作为目标方面一致性图的一个节点,将句子顶点集合中的每个句子顶点作为目标方面一致性图的一个节点,将每个句子顶点对应的节点与方向编码向量对应的节点相连。

对于S653,采用内部方面一致性编码层,基于图注意力机制来度量偏好度,从而根据目标方面一致性图分别进行每个句子顶点与方面之间的注意力权重计算,将计算得到的每个注意力权重作为第一注意力权重,将所有是第一注意力权重作为第一注意力权重集合。

也就是说,第一注意力权重集合中的第一注意力权重与目标方面一致性图中的句子顶点对应的节点一一对应。

对于S654,采用内部方面一致性编码层,根据第一注意力权重集合,将句子顶点集合中的每个句子顶点编码为方面相关的句子向量,将编码得到的每个向量作为一个第一句子向量,将所有第一句子向量作为第一句子向量结合。

也就是说,第一句子向量集合中的第一句子向量一一对应与目标方面一致性图中的句子顶点对应的节点一一对应。

在一个实施例中,上述第一注意力权重集合中的第一注意力权重的计算公式a

其中,a

第一句子向量集合中的第一句子向量的计算公式

其中,

本实施例实现了采用内部方面一致性编码层,根据目标方面一致性图进行句子顶点与方面之间的注意力权重计算,得到第一注意力权重集合,采用内部方面一致性编码层,根据第一注意力权重集合和句子顶点集合分别进行每个句子顶点的编码,得到第一句子向量集合,实现了利用注意力机制学习方面相关句子表征以提高预测的准确性,利用内部方面一致性通过其他句子给出正确的判断,提高了情感分类模型进行情感分类概率预测的准确性。

在一个实施例中,上述采用初始模型的方面倾向性编码层,根据句子编码向量集合分别进行每个句子编码向量的方面倾向性编码,得到第二句子向量集合的步骤,包括:

S661:采用方面倾向性编码层,根据句子顶点集合进行方面的倾向性图构建,得到目标方面倾向性图;

S662:采用方面倾向性编码层,根据目标方面倾向性图进行句子顶点之间的注意力权重计算,得到第二注意力权重向量集合;

S663:采用方面倾向性编码层,根据第二注意力权重向量集合和句子顶点集合分别进行每个句子顶点的编码,得到第二句子向量集合。

本实施例实现了首先进行方面的倾向性图构建,然后进行句子顶点之间的注意力权重计算,最后进行每个句子顶点的编码,从而实现了利用方面倾向性可以在隐晦而难以判断的文本中通过整体的情感判断给出对象的情感,从而提高了情感分析的准确性。

对于S661,方面倾向性,是指在同一个评价文本中句子顶点和相邻的句子顶点有情感倾向性。

采用方面倾向性编码层,根据句子顶点集合进行句子顶点与句子顶点的倾向性图构建,将构建得到的方面倾向性图作为目标方面倾向性图。

其中,将句子顶点集合中的每个句子顶点作为目标方面倾向性图的一个节点,将相邻的句子顶点对应的节点相连。

对于S662,采用方面倾向性编码层,基于图注意力机制来度量偏好度,从而根据目标方面倾向性图分别进行句子顶点与句子顶点之间的注意力权重计算,将针对每个句子顶点计算得到的所有注意力权重作为第二注意力权重向量,将所有第二注意力权重向量作为第二注意力权重向量集合。也就是说,第二注意力权重向量中每个向量元素代表两个句子顶点之间的注意力权重。

也就是说,第二注意力权重向量集合中的第二注意力权重向量与目标方面倾向性图中的句子顶点对应的节点一一对应。

对于S663,采用方面倾向性编码层,根据第二注意力权重集合,将句子顶点集合中的每个句子顶点编码为句子向量,将编码得到的每个向量作为一个第二句子向量,将所有第二句子向量作为第二句子向量结合。

也就是说,第二句子向量集合中的第二句子向量与句子顶点集合中的句子顶点一一对应。

在一个实施例中,上述第一注意力权重集合中的第一注意力权重a

其中,a

第二句子向量集合中的第二句子向量的计算公式

其中,

本实施例实现了进行句子顶点之间的注意力权重计算,最后进行每个句子顶点的编码,从而实现了利用方面倾向性可以在隐晦而难以判断的文本中通过整体的情感判断给出对象的情感,从而提高了情感分析的准确性。

在一个实施例中,上述采用初始模型的句子融合层,根据第一句子向量集合和第二句子向量集合进行句子向量融合,得到目标句子向量集合的步骤,包括:

S671:采用句子融合层的向量拼接子层,根据第一句子向量集合和第二句子向量集合分别进行每个句子对样本对应的句子向量拼接,得到句子向量拼接结果集合;

S672:采用句子融合层的多个特征提取子层,根据句子向量拼接结果集合的每个句子向量拼接结果进行特征提取,得到每个句子向量拼接结果对应的待融合句子向量集合;

S673:采用句子融合层的自适应融合子层,分别对各个待融合句子向量集合进行融合,得到目标句子向量集合;

其中,待融合句子向量集合中的待融合句子向量的计算公式

句子顶点集合中第i个句子顶点对应的目标句子向量的计算公式r

本实施例根据第一句子向量集合和第二句子向量集合先进行每个句子对样本对应的句子向量拼接,然后对拼接得到的每个向量进行特征提取及特征融合,从而实现将内部方面一致性通过其他句子给出正确的判断,以及利用方面倾向性可以在隐晦而难以判断的文本中通过整体的情感判断给出对象的情感进行融合,为准确的进行情感分类提供了基础。

对于S671,从待训练的训练样本的句子对样本集合中获取一个句子对样本作为目标句子对样本;将目标句子对样本在第一句子向量集合中对应的第一句子向量作为目标第一句子向量;将目标句子对样本在第二句子向量集合中对应的第二句子向量作为目标第二句子向量;将目标第一句子向量和目标第二句子向量进行拼接,得到目标句子对样本对应的句子向量拼接结果;重复执行从待训练的训练样本的句子对样本集合中获取一个句子对样本作为目标句子对样本的步骤,直至完成待训练的训练样本的句子对样本集合中的句子对样本的获取;将所有句子向量拼接结果作为句子向量拼接结果集合。可以理解的是,上述步骤实现为句子融合层的向量拼接子层。

对于S672,多个特征提取子层构成金字塔。句子向量拼接结果集合的每个句子向量拼接结果输入多个特征提取子层构成的金字塔的底部。

其中,从句子向量拼接结果集合中获取一个句子向量拼接结果作为目标句子向量拼接结果;将目标句子向量拼接结果输入多个特征提取子层进行特征提取,将每个特征提取子层提取到的特征向量作为目标句子向量拼接结果对应的待融合句子向量集合中的一个待融合句子向量;重复执行从句子向量拼接结果集合中获取一个句子向量拼接结果作为目标句子向量拼接结果的步骤,直至完成句子向量拼接结果集合中的句子向量拼接结果的获取。也就是说,待融合句子向量是一个特征提取子层提取到的特征向量。

也就是说,待融合句子向量集合中的待融合句子向量与句子向量拼接结果集合中的句子向量拼接结果一一对应。

对于S673,采用句子融合层的自适应融合子层,将待融合句子向量集合中的各个待融合句子向量进行融合处理,将融合处理得到的每个向量作为一个目标句子向量,将所有目标句子向量作为目标句子向量集合。

参照图2,本申请还提出了一种基于文档级情感倾向的情感分类装置,装置包括:

数据获取模块100,用于获取目标评价文本和方面情感提取规则,其中,方面情感提取规则包括评价对象和评价方向;

句子集合确定模块200,用于对目标评价文本进行句子提取,得到句子集合;

目标实体属性对确定模块300,用于从句子集合中提取得到与评价对象对应的目标实体属性对;

目标疑问句确定模块400,用于获取与评价方向对应的目标疑问句模板,根据目标疑问句模板和目标实体属性对进行疑问句构造,得到目标疑问句;

目标句子对集合确定模块500,用于将句子集合中的每个句子分别与目标疑问句进行拼接,得到目标句子对集合;

情感分类概率向量确定模块600,用于将目标实体属性对和目标句子对集合输入情感分类模型进行情感分类概率预测,得到情感分类概率向量,其中,情感分类模型是基于注意力机制、内部方面一致性和方面倾向性联合建模得到的模型;

目标情感分类确定模块700,用于根据情感分类概率向量进行情感分类确定,得到目标情感分类。

本实施例通过首先对目标评价文本进行句子提取,得到句子集合,从句子集合中提取得到与评价对象对应的目标实体属性对,获取与评价方向对应的目标疑问句模板,根据目标疑问句模板和目标实体属性对进行疑问句构造,得到目标疑问句,将句子集合中的每个句子分别与目标疑问句进行拼接,得到目标句子对集合,然后将目标实体属性对和目标句子对集合输入情感分类模型进行情感分类概率预测,得到情感分类概率向量,其中,情感分类模型是基于注意力机制、内部方面一致性和方面倾向性联合建模得到的模型,最后根据情感分类概率向量进行情感分类确定,得到目标情感分类,实现了采用基于注意力机制、内部方面一致性和方面倾向性联合建模得到的模型进行情感分类概率预测,利用注意力机制学习方面相关句子表征以提高预测的准确性,利用内部方面一致性通过其他句子给出正确的判断,以及利用方面倾向性可以在隐晦而难以判断的文本中通过整体的情感判断给出对象的情感,从而提高了情感分析的准确性。

参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于储存基于文档级情感倾向的情感分类方法等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于文档级情感倾向的情感分类方法。基于文档级情感倾向的情感分类方法,包括:获取目标评价文本和方面情感提取规则,其中,方面情感提取规则包括评价对象和评价方向;对目标评价文本进行句子提取,得到句子集合;从句子集合中提取得到与评价对象对应的目标实体属性对;获取与评价方向对应的目标疑问句模板,根据目标疑问句模板和目标实体属性对进行疑问句构造,得到目标疑问句;将句子集合中的每个句子分别与目标疑问句进行拼接,得到目标句子对集合;将目标实体属性对和目标句子对集合输入情感分类模型进行情感分类概率预测,得到情感分类概率向量,其中,情感分类模型是基于注意力机制、内部方面一致性和方面倾向性联合建模得到的模型;根据情感分类概率向量进行情感分类确定,得到目标情感分类。

本实施例通过首先对目标评价文本进行句子提取,得到句子集合,从句子集合中提取得到与评价对象对应的目标实体属性对,获取与评价方向对应的目标疑问句模板,根据目标疑问句模板和目标实体属性对进行疑问句构造,得到目标疑问句,将句子集合中的每个句子分别与目标疑问句进行拼接,得到目标句子对集合,然后将目标实体属性对和目标句子对集合输入情感分类模型进行情感分类概率预测,得到情感分类概率向量,其中,情感分类模型是基于注意力机制、内部方面一致性和方面倾向性联合建模得到的模型,最后根据情感分类概率向量进行情感分类确定,得到目标情感分类,实现了采用基于注意力机制、内部方面一致性和方面倾向性联合建模得到的模型进行情感分类概率预测,利用注意力机制学习方面相关句子表征以提高预测的准确性,利用内部方面一致性通过其他句子给出正确的判断,以及利用方面倾向性可以在隐晦而难以判断的文本中通过整体的情感判断给出对象的情感,从而提高了情感分析的准确性。

本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种基于文档级情感倾向的情感分类方法,包括步骤:获取目标评价文本和方面情感提取规则,其中,方面情感提取规则包括评价对象和评价方向;对目标评价文本进行句子提取,得到句子集合;从句子集合中提取得到与评价对象对应的目标实体属性对;获取与评价方向对应的目标疑问句模板,根据目标疑问句模板和目标实体属性对进行疑问句构造,得到目标疑问句;将句子集合中的每个句子分别与目标疑问句进行拼接,得到目标句子对集合;将目标实体属性对和目标句子对集合输入情感分类模型进行情感分类概率预测,得到情感分类概率向量,其中,情感分类模型是基于注意力机制、内部方面一致性和方面倾向性联合建模得到的模型;根据情感分类概率向量进行情感分类确定,得到目标情感分类。

上述执行的基于文档级情感倾向的情感分类方法,通过首先对目标评价文本进行句子提取,得到句子集合,从句子集合中提取得到与评价对象对应的目标实体属性对,获取与评价方向对应的目标疑问句模板,根据目标疑问句模板和目标实体属性对进行疑问句构造,得到目标疑问句,将句子集合中的每个句子分别与目标疑问句进行拼接,得到目标句子对集合,然后将目标实体属性对和目标句子对集合输入情感分类模型进行情感分类概率预测,得到情感分类概率向量,其中,情感分类模型是基于注意力机制、内部方面一致性和方面倾向性联合建模得到的模型,最后根据情感分类概率向量进行情感分类确定,得到目标情感分类,实现了采用基于注意力机制、内部方面一致性和方面倾向性联合建模得到的模型进行情感分类概率预测,利用注意力机制学习方面相关句子表征以提高预测的准确性,利用内部方面一致性通过其他句子给出正确的判断,以及利用方面倾向性可以在隐晦而难以判断的文本中通过整体的情感判断给出对象的情感,从而提高了情感分析的准确性。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号