首页> 中文学位 >基于表示学习的情感分析关键技术研究
【6h】

基于表示学习的情感分析关键技术研究

代理获取

目录

第1章绪论

1 .1课题背景和意乂

1 .2国内外研究现状

1 .3本文的主要研究内容

1 .4本文的内容安排

第2章基于长短时记忆网络组合模型的短文本极性分类

2 .1引言

2 .2基于简单循环神经网络的文本表示

2 .3基于长短时记忆网络文本表示

2 .4实验及分析

2 .5本章小结

第3章基于双向长短时记忆网络的情感表达抽取

3 .1引言

3 .2情感表达的类别与抽取评价指标

3 .3基于简单循环网络的情感表达抽取

3 .4基于长短时记忆网络序列标注器的情感表达抽取

3 .5实验及分析

3 .6本章小结

第4章基于词向量改进的情感对象属性抽取

4 .1引言

4 .2意见评论中的属性抽取

4 .3基于依存句法的词向量

4 .4基于外积矩阵的词向量扩展

4 .5基于特化输入门的特征融合

4 .6实验及分析

4 .7本章小结

第5章基于语句序列表示学习的多轮人机对话情绪预测

5 .1引言

5 .2问题定义与相关研究

5 .3情绪决定要素的假设与建模

5 .4数据构建与预训练策略

5 .5实验及分析

5 .6本章小结

结论

参考文献

攻读博士学位期间发表的论文

声明

致谢

个人简历

展开▼

摘要

文本情感分析技术可以挖掘互联网文本中蕴含的情感信息,使我们高效的了解人们针对某实体的观点,并根据这些观点做出决策。然而当今互联网应用中的文本特点却对传统情感分析技术形成了挑战:首先,无标注文本的数量越来越多,标注文本却始终稀缺,如何利用无标注数据提高情感分析方法的性能,是目前亟待解决的问题;此外,文本变得简洁且随意,这使得基于词袋的传统特征面临严重的稀疏性问题;另外,不同应用场景的互联网产品层出不穷,针对性的特征工程耗时较长,难以适应快速迭代的文本的分析需求。
  词向量特征(即词的分布式特征表示)可利用无监督方法训练得到,可以有效利用大量无标注数据;相似的词对应的词向量相似,因而,词向量作为特征可以起到平滑的作用,缓解稀疏性问题;基于深度神经网络的方法可以组合词向量,自动学习文本的抽象表示,无需耗费人力设计特征。因而,基于分布式特征表示和深度神经网络的表示学习技术,具有解决文本情感分析所面临的一系列问题的潜力。论文主要研宄如何利用表示学习技术解决情感分析中的若干关键问题。具体的,我们研究了利用含有门控操作的循环神经网络组合模型进行句子表示、句子序列的表示、词表示的方法以及词表示的改进策略,并将其应用于情感分析中的句子情感极性分类、情感表达抽取、情感对象属性抽取和多轮对话中的情绪预测四个任务。本文的主要内容包括以下四个方面。
  针对互联网短文本表达多样且规范性差带来的极性分类特征稀疏问题,本文提出了利用基于门控操作的循环网络组合模型进行情感语义表示学习的方法,并利用情感信息的抽象表示进行情感极性分类。实验表明,这一方法可以有效识别文本的极性类别。此外,文本对网络训练过程中的词向量变化进行了研宄,并结合长短时记忆单元的内部结构,对二者协同作用,模拟词与词间交互的机制进行了探讨。
  文本中的情感表达方式多种多样,难以总结其共性,隐式的情感表达往往不含情感词,更不易被传统的词袋特征所覆盖,且现有表示学习方法灵活性不足。为了解决这一问题,本文提出了基于长短时记忆网络的序列标注方法,以学习词的抽象语义表示,进而完成识别和抽取。实验表明,通过引入双向连接网络结构,长短时记忆网络可以有效提高情感表达的抽取性能。此外,还针对长短时记忆网络有能力进行信号分离和信息选择的特点进行了研宄,探讨了该结构在序列标注过程中的优势。
  情感对象的属性识别与候选文本中的词的联系密切,因而,词向量的质量直接影响着抽取的性能,但词向量作为词的分布式表示,本身存在诸多问题:其向量表示与对应词的功能间存在鸿沟,统计信息缺失,且具有意义上和功能上的歧义性。为解决这些问题,论文针对性的引入了基于依存句法的词向量和基于外积矩阵的扩展方法,并提出了基于长短时记忆单元特化输入门的词向量特化策略。实验表明,这些方法能够有效改善词向量,并提高属性抽取模型的性能。
  发现人机多轮对话中的用户负面情绪,可以为对话技术的评价和改进提供依据。然而,现有人机交互的方式使得我们难以直接获得用户的负面反馈。通过多轮对话的上下文预测用户的情绪则是获得此类信息的一种方法。我们对多轮对话的已知句子中可能影响用户情绪的多种因素提出假设,并针对性的建立了神经网络模型学习这些因素的抽象表示,用以预测用户的情绪反馈。实验结果表明,基于卷积循环神经网络的方法可以有效表示多轮对话中的文本序列和关系序列,从而并对用户情绪做出有效预测。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号