首页> 中国专利> 一种汉语三维六极情感计算模型构建方法

一种汉语三维六极情感计算模型构建方法

摘要

本发明公开了一种汉语三维六极情感计算模型构建方法,包括:对人类情感进行三个维度的分类,每个维度对应两种极性;构建三维情感坐标系;其中,三个维度分别围绕在以原点为中心的三维坐标轴中;对情感强度采用强度等级标记,构建出三维六极情感计算模型,并为每一维度每一种强度的情感构建对应的核心情感词。通过本发明方法构建出的情感计算模型可用于人工智能中计算机对人类情感类型的辨别和情感强度的计算,帮助计算机准确辨别中文文本情感类别,计算中文文本情感的具体强度,促进语言智能中计算机准确计算情感类别和情感强度,生成并理解情感,有感情的进行人机互动,实现情感计算。

著录项

  • 公开/公告号CN112632276A

    专利类型发明专利

  • 公开/公告日2021-04-09

    原文格式PDF

  • 申请/专利权人 北京语言大学;

    申请/专利号CN202011426092.1

  • 发明设计人 玄玥;邹娉娣;

    申请日2020-12-08

  • 分类号G06F16/35(20190101);G06F16/33(20190101);

  • 代理机构11237 北京市广友专利事务所有限责任公司;

  • 代理人张仲波;付忠林

  • 地址 100083 北京市海淀区学院路15号

  • 入库时间 2023-06-19 10:32:14

说明书

技术领域

本发明涉及人工智能技术领域,特别涉及一种汉语三维六极情感计算模型构建方法。

背景技术

在人工智能领域,想要实现计算机和人的有感情互动得先让计算机辨别出情感类别,计算出情感强度,然后进行有感情的互动。

而人类情感是一个复杂的心理过程,人类情感又丰富多样。对于基本情感的分类,目前主要有种类分类、维度分类,而对文本的情感分类又局限于正、负两极分类。不管是哪种分类,这类分析的结果也只是停留在一个结果,没有形成一个广泛认可的情感类型体系和情感类型判断标准,没有形成一种可具体感知的情感数据,不利于情感的计算,因此,需要对现有技术进行改进。

发明内容

本发明提供了一种汉语三维六极情感计算模型构建方法,以解决现有的人类情感分类方法的以下技术问题:没有形成一个广泛认可的情感类型体系和情感类型判断标准,没有形成一种可具体感知的情感数据,不利于情感计算。

为解决上述技术问题,本发明提供了如下技术方案:

一方面,本发明提供了一种汉语三维六极情感计算模型构建方法,包括:

对人类情感进行三个维度的分类,每个维度对应两种极性;

构建三维情感坐标系;其中,在所述三维情感坐标系中,分类出的三个维度围绕在以原点为中心的三维坐标轴中;每一根坐标轴代表一种单维度情感,多根坐标轴组成的平面或者空间代表由不同的单维度情感组合成的复合情感;

对情感强度采用强度等级标记,构建出三维六极情感计算模型。

进一步地,在对情感强度采用强度等级标记之后,所述方法还包括:

为每一维度每一种强度的情感构建对应的核心情感词。

进一步地,对情感进行三个维度的分类,每个维度对应两种极性,包括:

对人类情感进行三个维度的分类,分为“愉悦”维度、“控制”维度和“意料”维度;其中,“愉悦”维度对应“喜和哀”两种极性,“控制”维度对应“怒和惧”两种极性,“意料”维度对应“欲和惊”两种极性。

进一步地,所述对情感强度采用强度等级标记,包括:

将情感强度划分为低强度、中强度和高强度,对应的数值分别为:1,3,5;其中,低强度词语的判断标准为:词典释义里没有任何程度词语修饰,也没有任何外化的行为表现的词语;中强度词语的判断标准为:词典释义里有表示程度的词语修饰,或者有外化的行为表现;高强度词语的判断标准为:词典释义里有表示程度达到极端的程度词语修饰,或者有表示“极端”的外化行为表现。

进一步地,在汉语三维六极情感计算模型中,实线代表正向情感,强度等级分别用1,3,5表示;虚线代表负向情感,强度等级分别用-1,-3,-5表示。

进一步地,在所述汉语三维六极情感计算模型中,以原点为始点,离原点越近,表示相应情感强度越低;离原点越远,表示相应情感强度越高。

进一步地,为每一维度每一种强度的情感构建对应的核心情感词,包括:

确立每一维度的单维度情感词;

从单维度情感词中提取对应维度的每一强度的核心情感词。

进一步地,所述确立每一维度的单维度情感词,包括:

以双音节词的单维度情感词为基础,通过对预设词库的搜寻和释义查找、对比,筛选出单维度情感词,所述单维度情感词包括名词、动词和形容词。

进一步地,单维度低强度核心情感词的确立标准包括:1.有且仅有一个语义特征;2.语义特征不受语境影响,在任何语境中语义特征的感情色彩都不会相互对立;3.具有定义词汇的功能,可解释、替代非核心情感词;4.在预设词库中使用频率大于预设频率阈值;5.在预设词库中的词语释义中没有语体色彩的标注;

中、高强度核心情感词的确立标准包括:1.有两个语义特征,即一个语义特征表示情感类别,另一个语义特征表示情感强度;2.语义特征不受语境影响,在任何语境中语义特征的感情色彩不对立;3.在预设词库中的词语释义中没有语体色彩标注;4.在预设词库中使用频率大于预设频率阈值;5.对于具有定义词汇的功能,作为选择性的参考;对于具有定义词汇功能的中、高强度情感词,这条标准就是一条优势标准,但对于不具有定义词汇功能的中、高强度情感词,这条标准将不参考,而依据前四条标准。

进一步地,核心情感词依据每一种强度的划分,分别伫立在每一强度标记之处;其中,

所述愉悦维度的“喜”极性的低强度核心情感词包括:高兴、快乐和满意;中强度核心情感词包括:欢呼、微笑和笑容;高强度核心情感词包括:得意、狂喜和狂欢;“哀”极性的低强度核心情感词包括:悲哀、难过、痛苦和伤心;中强度核心情感词包括:哽咽和哭泣;高强度核心情感词包括:悲惨和沉痛;

所述控制维度的“怒”极性的低强度核心情感词包括:恼怒;中强度核心情感词包括:发怒、怒目和怒色;高强度核心情感词包括:愤怒、震怒和暴怒;

所述意料维度的“欲”极性的低强度核心情感词包括:希望、愿望、心愿和意愿;中强度核心情感词包括:盼望和向往;高强度核心情感词包括:渴望、梦想和欲望;“惊”极性的低强度核心情感词包括:诧异、吃惊和奇怪;中强度核心情感词包括:惊讶;高强度核心情感词包括:震惊。

另一方面,本发明还提供了一种电子设备,其包括处理器和存储器;其中,存储器中存储有至少一条指令,所述指令由处理器加载并执行以实现上述方法。

又一方面,本发明还提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现上述方法。

本发明提供的技术方案带来的有益效果至少包括:

本发明提供了一种三个维度六种极性的情感模型,该情感模型将人类情感分为8个不同的立体空间,以原点为中心,分别向8个不同立体空间分布;其中,每一根数轴对应的不同强度单维度核心情感词又为该强度情感词确立了标杆,凝聚更多的单维度情感词,从而更好地对复合情感词进行情感分解与分析,才能为所有情感词在该模型里的合适位置找到依据。因此本发明的理想效果是在人工智能中帮助计算机精准分析、定位情感类别,从而精准计算情感强度。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为通过本发明实施例提供的汉语三维六极情感计算模型构建方法构建的未标示核心情感词的汉语三维六极情感计算模型的示意图;

图2为通过本发明实施例提供的汉语三维六极情感计算模型构建方法构建的汉语三维六极情感计算模型的示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。

第一实施例

本实施例提供了一种汉语三维六极情感计算模型构建方法,该方法可由电子设备实现,该电子设备可以是终端或服务器。本实施例首先解决了人类基本情感分类的问题。人类情感多种多样,能表现出不同强度的情感。同时人类情感又复杂多样,既能表现出单纯的情感(即单维度情感),也能表现出多种情感复杂组合的复合情感。复杂组合的复合情感很大程度上是在单纯情感的基础上的不同组合,组合的复合情感可以被分解为不同强度单纯情感的组合。通过本方法构建的模型既能体现人类情感的多样性,又能体现人类情感的复杂性。其次,本实施例解决了情感计算的问题。本实施例通过对情感的赋值将情感进行数值化统计。赋值的方式能将汉语情感词进行强度划分,这样不仅单纯情感词能精准定位于坐标轴上,复合情感词也能精准定位于坐标轴之中,使所有情感词都能精准定位。

基于上述,本实施例的汉语三维六极情感计算模型构建方法包括以下步骤:

S1,对人类情感进行三个维度的分类,每个维度对应两种极性。

具体地,在本实施例中,对人类情感进行三个维度的分类,分为“愉悦”维度、“控制”维度和“意料”维度;其中,“愉悦”维度对应“喜--哀(-喜)”两种极性;“控制”维度对应“怒--惧(-怒)”两种极性;“意料”维度对应“欲--惊(-欲)”两种极性。

需要说明的是,对于正负极性的划分是建立在同一维度中的两种不同极性的情感。事物之间具有相关性、对立性、统一性的特征。正负两种不同极性的情感对立统一于同一情感维度。“喜”和“哀”相互对立,同时“喜”和“哀”分别与“愉悦度”有关,“喜”表示愉悦,“哀”表示悲哀。“怒”和“惧”相互对立,同时“怒”和“惧”分别与“控制”有关。“怒”表示愤怒,这种情感可以由发出主体控制;“惧”表示恐惧,这种情感不能由发出主体控制。“欲”与“惊”相互对立,同时又与意料有关。“欲”表示欲望,表示一种带有强烈预期的意料,“惊”表示惊奇,表示一种意料之外的惊奇。

S2,构建三维情感坐标系;

其中,在三维情感坐标系中,分类出的三个维度围绕在以原点为中心的三维坐标轴中;每一根坐标轴代表一种单维度情感,多根坐标轴组成的平面或者空间代表由不同的单维度情感组合成的复合情感;不同的单维度情感可以组合成复合情感,复杂组合的复合情感也可以分解为不同的单维度情感的组合。

S3,对情感强度采用强度等级标记,构建出三维六极情感计算模型。

具体地,在本实施例中,对情感强度采用强度等级标记,低强度、中强度、高强度,对应的数值分别为:1,3,5。在本实施例所构建的三维六极情感模型中,实线代表正向情感,强度等级分别用1,3,5表示;虚线代表负向情感,强度等级分别用-1,-3,-5表示。如图1所示,这样以原点为始点,离原点越近,表示这种情感强度越低;离原点越远,表示这种情感强度越高。而对于原点,并不是没有情感,而是表示情感处于一种平和的、稳定的状态。

至此,本实施例的维度与极性以及情感强度的数值标记等将情感词能大致归类。单维度情感词分布在每一根数轴上,复合情感词分布在相应空间里。

需要说明的是,本实施例对于情感强度的赋值标准,依据《现代汉语词典》(第7版)的词典释义,从低强度到高强度,情感强度依次递增。其中,

低强度词语的判断标准为:词典释义里没有任何程度词语修饰,也没有任何外化的行为表现的词语;中强度词语的判断标准为:词典释义里有“很”、“非常”等表示程度的词语修饰,或者有外化的行为表现;高强度词语的判断标准为:词典释义里有“极点”、“极了”等表示程度达到极端的程度词语修饰,或者有表示“极端”的外化行为表现。所以情感强度的体现,以词典释义的程度词语的程度为依据、以外化的行为表现为依据,强度不断增强。而低强度、中强度、高强度对应的赋值分别为:1,3,5。这样情感强度体现于情感数值,这能将情感强度进行数值化统计,以便于人工智能中计算机精准计算情感强度。

S4,为每一维度每一种强度的情感构建对应的核心情感词。

需要说明的是,由于复合情感词由单维度情感词组合而成,因而单维度情感词是复合情感词的基础,于是以情感强度为基础,每一种强度情感都有对应的核心情感词,具体地,在本实施例中,对单维度核心情感词的确立分为两步:第一步,确立单维度情感词;第二步,从单维度情感词中提取核心情感词。

确立单维度情感词:人类情感复杂多样,情感表达可以通过面部表情、声音、音调、动作、姿势、文本来表达。文本的情感表达主要体现在情感词上。情感词包含一切能够表达的词语,如动词、名词、形容词、副词、语气词等,这些词可以是单音节词、双音节词、多音节词。结合汉语语法特点:单音节语素多,双音节词占优势的特点,双音节词结构固定,意义相对较少,因此在单维度情感词的确立过程中以双音节词为标准。因此在“喜--哀(-喜)”情感维度里,“喜”表示“高兴”,“哀(-喜)”表示“悲哀”;在“怒--惧(-怒)”情感维度里,“怒”表示“愤怒”,“惧(-怒)”表示“恐惧”;在“欲--惊(-欲)”情感维度里,“欲”表示“欲望”,“惊(-欲)”表示“惊奇”。因此以这些双音节词的单维度情感词为基础,通过对《同义词词林扩展板》的搜寻以及《现代汉语词典》(第7版)释义查找、对比,筛选出的情感词主要包括名词、动词、形容词。

从单维度情感词中提取核心情感词:核心情感词依据每一强度的划分,分别伫立在每一强度标记处,像一个标杆,凝集更多同强度的单维度情感词,从而更好地对复合情感词进行情感分解与分析,为所有情感词在该模型里的合适位置找到依据,进而更方便计算机对情感的精准分析和计算。其中,低强度核心情感词是最基本最核心的情感词,而中强度、高强度核心情感词是在低强度核心情感词的基础上,强度一步一步加深。

单维度低强度核心情感词的确立标准为:1.有且仅有一个语义特征;2.语义特征不受语境影响,在任何语境中语义特征的感情色彩都不会相互对立;3.具有定义词汇的功能,可以解释、替代非核心情感词;4.在《现代汉语词频词典》中使用频率高;5.在《现代汉语词典》(第7版)词语释义中没有语体色彩的标注,也就是没有标注为书面语、口语、方言词语。

因中强度情感词和高强度情感词是在低强度情感词基础上情感强度的加深,所以低强度情感词语是最基础最核心的词汇,而对于中强度和高强度的情感词,它们的词典释义能用低强度情感词来解释,但是它们并不都能解释同一强度其他情感词。因为中强度情感词和高强度情感词,较于低强度的情感词而言,有一个外化的行为体现或者是程度的加深,所以中强度情感词、高强度情感词的语义特征至少会有两个语义特征,即一个表示具体的某种情感,一个表示程度深或者表示外化的行为表现。因此,对于中强度和高强度的核心情感词的确立与低强度核心情感词的确立标准有一些区别。

中、高强度核心情感词的确立标准为:1.有两个语义特征,即一个语义特征表示情感类别,另一个语义特征表示情感强度;2.语义特征不受语境影响,在任何语境中语义特征的感情色彩不对立;3.在《现代汉语词典》(第7版)词语释义中没有语体色彩标注,即没有标注为书面语、口语、方言词语;4.在《现代汉语频率词典》中使用频率高。5.对于具有定义词汇的功能,即核心情感词可以解释、替代非核心情感词功能这一标准,作为选择性的参考。对于有定义词汇功能的中、高强度情感词,这条标准就是一条优势标准,但对于不能定义其他词汇的中、高强度情感词,这条标准将不参考,而依据前四条标准。

结合以上标准,进而从单维度情感词中提出每一维度,每一强度的核心情感词,具体如下:愉悦维度“喜”低强度核心情感词:高兴、快乐、满意;中强度核心情感词:欢呼、微笑、笑容;高强度核心情感词:得意、狂喜、狂欢;“哀(-喜)”低强度核心情感词:悲哀、难过、痛苦、伤心;中强度核心情感词:哽咽、哭泣;高强度核心情感词:悲惨、沉痛。控制维度“怒”低强度核心情感词:恼怒;中强度核心情感词:发怒、怒目、怒色;高强度核心情感词:愤怒、震怒、暴怒。意料维度“欲”核心情感词:希望、愿望、心愿、意愿;中强度核心情感词:盼望、向往;高强度核心情感词:渴望、梦想、欲望;“惊(-欲)”低强度核心情感词:诧异、吃惊、奇怪;中强度核心情感词:惊讶;高强度情感词:震惊。如图2所示,需要说明的是,因此处模型标注空间有限,故核心情感词大于1个的都以音序为基础选择一个标注在模型里。

综上,本实施例考虑到了人类情感的复杂多样性,通过分类与赋值的方式将所有情感集中于一个情感模型之中,这能综合体现情感类别,体现了人类情感的复杂与多样。通过本实施例的方法所构建的模型是一个能涵盖所有情感的系统性、综合性的情感模型,结合了目前对人类基本情感的研究,首次将人类基本情感的划分立体化,使得全部人类情感能够综合化、系统化地呈现在本实施例的模型里。同时本实施例还采用数值的形式对情感强度进行划分,赋值的方式能将汉语情感词进行强度划分,将情感强度进行数值化统计,使抽象的情感有了数值依据,从而更能感知情感强度,计算情感强度。这样不仅单纯情感词能精准定位于坐标轴上,复合情感词也能精准定位于坐标轴之中,使所有情感词都能精准定位。从而解决了现有研究中对情感词要么是种类分类,要么是维度分类,要么是正、负两极分类,对情感强度不能精准定位、不能精准计算的问题。通过本实施例方法构建的模型可用于对汉语情感词进行分类辨别、并对情感强度进行数值定位,该模型既能辨别情感类别,又能进行情感强度计算。

第二实施例

本实施例提供一种电子设备,其包括处理器和存储器;其中,存储器中存储有至少一条指令,所述指令由处理器加载并执行,以实现第一实施例的方法。

该电子设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)和一个或一个以上的存储器,其中,存储器中存储有至少一条指令,所述指令由处理器加载并执行上述方法。

第三实施例

本实施例提供一种计算机可读存储介质,该存储介质中存储有至少一条指令,所述指令由处理器加载并执行,以实现上述第一实施例的方法。其中,该计算机可读存储介质可以是ROM、随机存取存储器、CD-ROM、磁带、软盘和光数据存储设备等。其内存储的指令可由终端中的处理器加载并执行上述方法。

此外,需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

最后需要说明的是,以上所述是本发明优选实施方式,应当指出,尽管已描述了本发明优选实施例,但对于本技术领域的技术人员来说,一旦得知了本发明的基本创造性概念,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号