基于词典扩增和修饰结构的文本情感识别研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

情感计算是自然语言处理领域中一个热门的研究方向，并且随着网络资料量的累积，对于巨量文本的情感计算也已经成为大数据研究领域的一个重要分支。以往的绝大部分的研究是将情感划分成不同的类别，之后再判断文本的情感属于哪种提前划分好的类别。
　　然而我们并不能准确的划分出情感有多少种类别，于是本文使用一种多维度模型，将文本的情绪转化成两组连续的分值加以量化。情感可以转化成两个维度分别是Valence(表示情感的正负程度)和Arousal(表示情感的平静与激动程度)，Valence和Arousal的值在一至九连续分布。通过这种方式可以将情感映射到二维平面上从而避免需要准确界定情感类别的问题。
　　本文采用字典法，计算文本的Valence-Arousal值。字典包含了有标记Valence和Arousal的情绪词，通过识别文本中的情绪词来计算全文的Valence-Arousal值。然而，字典法也存在两个主要的缺点：一、字典中所包含的情绪词有限，大量人工标记的成本又太高；二、文本中情感词往往会与修饰语一起出现如“高兴”当有“不”修饰时情绪的Valence和Arousal值会有很大的变化。针对以上问题本文提出了一种基于词相似度的回归模型用来自动扩增情绪字典的方法以弥补情绪词有限的问题，并且构建了一个可量化的修饰语影响模型以计算修饰语对情绪词分值的影响。
　　由于没有中文的Valence-Arousal字典和语料库，本文花费了大量的时间完成了一个包含1653词的中文Valence-Arousal字典以及一个包含720篇文本的原始语料库作为研究的基础。

著录项

作者
郝帅;
展开▼
作者单位

南昌大学;

展开▼
授予单位南昌大学;
学科软件工程
授予学位硕士
导师姓名胡军;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类算法理论;
关键词
情感计算; 词典扩增; 修饰结构; 文本情感识别; 自然语言处理; Arousal;

相似文献

中文文献
外文文献
专利

1. 基于向量机的文本分类中词典结构研究 [J] . 郝海涛 . 福建电脑 . 2009,第003期
2. 电子词典微观结构中的多符号整合模式——基于《牛津高阶英语学习词典(第八版)》光盘版的个案研究 [J] . 罗永胜 . 外语电化教学 . 2012,第4期
3. 基于MOOC平台数学类课程情感词典的文本分析研究 [J] . 刘娟 ,谭均翘 ,张靖红 . 科教导刊 . 2021,第019期
4. 基于文本挖掘的语词典研究 [J] . 严建军 ,彭雯 . 无线互联科技 . 2020,第011期
5. 基于情感词典的中国英语学习者写作文本的情感挖掘研究 [J] . 钱深华 ,刘靓 . 天津外国语大学学报 . 2020,第004期
6. 基于词典的在线新闻自动文本摘要系统的研究与实现 [C] . 官礼和 ,李永礼 . 2003年全国理论计算机科学学术年会 . 2003
7. 基于深度学习和词典的二阶段中文文本情感识别及应用研究 [A] . 薛兴荣 . 2020

基于词典扩增和修饰结构的文本情感识别研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅