首页> 中文学位 >基于词典扩增和修饰结构的文本情感识别研究
【6h】

基于词典扩增和修饰结构的文本情感识别研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章 绪论

1.1 课题背景

1.2 研究的目的和意义

1.3 本文的主要研究内容

1.4 论文章节安排

第2章 国内外研究成果

2.1 自然语言处理的发展历史

2.2情感计算的研究的现状

第3章 构建情绪字典与语料库

3.1情感分析资源综述

3.2构建Valence-Arousal情绪词典

3.3构建Valence-Arousal语料库

第4章 构建文本情绪预测模型

4.1情绪词典扩增模型

4.2词相似度的计算

4.3构建情感词修饰语模型

4.4预测文本的Valence-Arousal值

第5章 实验结果与分析

5.1训练集和测试集

5.2预测效果

5.3误差分析

第6章 总结与展望

6.1本文总结

6.2未来展望

致谢

参考文献

附录A 情绪词典

展开▼

摘要

情感计算是自然语言处理领域中一个热门的研究方向,并且随着网络资料量的累积,对于巨量文本的情感计算也已经成为大数据研究领域的一个重要分支。以往的绝大部分的研究是将情感划分成不同的类别,之后再判断文本的情感属于哪种提前划分好的类别。
  然而我们并不能准确的划分出情感有多少种类别,于是本文使用一种多维度模型,将文本的情绪转化成两组连续的分值加以量化。情感可以转化成两个维度分别是Valence(表示情感的正负程度)和Arousal(表示情感的平静与激动程度),Valence和Arousal的值在一至九连续分布。通过这种方式可以将情感映射到二维平面上从而避免需要准确界定情感类别的问题。
  本文采用字典法,计算文本的Valence-Arousal值。字典包含了有标记Valence和Arousal的情绪词,通过识别文本中的情绪词来计算全文的Valence-Arousal值。然而,字典法也存在两个主要的缺点:一、字典中所包含的情绪词有限,大量人工标记的成本又太高;二、文本中情感词往往会与修饰语一起出现如“高兴”当有“不”修饰时情绪的Valence和Arousal值会有很大的变化。针对以上问题本文提出了一种基于词相似度的回归模型用来自动扩增情绪字典的方法以弥补情绪词有限的问题,并且构建了一个可量化的修饰语影响模型以计算修饰语对情绪词分值的影响。
  由于没有中文的Valence-Arousal字典和语料库,本文花费了大量的时间完成了一个包含1653词的中文Valence-Arousal字典以及一个包含720篇文本的原始语料库作为研究的基础。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号