首页> 中文学位 >基于深度学习的多元文本情感分析
【6h】

基于深度学习的多元文本情感分析

代理获取

目录

第一个书签之前

展开▼

摘要

随着移动互联网和大数据时代的到来,爆炸式的海量信息急需要我们去处理分析,基于文本的情感分析技术也越来越成为研究热点。互联网的文本信息多带着人们的主观情绪、每种情绪的类别亦有所不同,比如喜爱、愤怒、悲伤、难受、赞扬、等。情感分析又称作情感挖掘或者意见挖掘,它主要包含的研究内容是情感信息分类任务、情感信息抽取任务等。传统的情感分析方法主要包括基于机器学习算法的研究和基于情感词典的构建研究,前者会存在特征选择困难,人工标注训练集困难,模型简单,系统可扩展性不足,准确率低等缺点,后者会存在覆盖率不足,模型泛化能力弱的缺点。 为了定量地得到文本内容的情感倾向,有效地体现出不同文本的情感粒度和强度,避免情感二元极性划分带来的情感表达不充分的、不全面和过于生硬暴力的问题,构建了针对多元情感分析的语义情感数据集,并且结合Co-Training文本标注方法,减少了单纯进行人工标注带来的误差,增强了模型数据的健壮性和泛化能力。 为了有效地结合文本的情感信息,抽取更加深层次的语义情感表征,提出了更加泛化的情感词向量模型算法,将情感词典、情感词频-逆文档概率和情感词向量三者有效地结合起来,充分地考虑到了三者的优点,提出了结合情感词向量和情感词典的D&W词向量、结合情感词向量和情感词频的T&W词向量、结合情感词频和情感词典以及情感词向量的SSW情感语义词向量。三种新的词向量模型分别和基准词向量模型进行对比,在公开数据集上面进行的文本二元分类实验的准确度提升了5%。 将新的词向量模型应用在深度学习模型的词向量表征上面,利用CNN和LSTM神经网络结构模型分别对构建的多元情感数据集进行了情感词向量的模型优化和对比训练,通过对模块进行叠加训练对比实验,提升了文本情感多元分类的准确度、召回率和F1值,将它们分别提升了5%-10%,证明了和基准词向量模型相比,新的词向量模型能够在文本情感多元分类任务中取得更加优秀的效果,从而验证了情感词向量表达的有效性。

著录项

  • 作者

    陈楠;

  • 作者单位

    华中科技大学;

  • 授予单位 华中科技大学;
  • 学科 计算机系统结构
  • 授予学位 硕士
  • 导师姓名 陈进才;
  • 年度 2018
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类
  • 关键词

    深度学习;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号