首页> 中文学位 >基于复杂句式文本情感分类研究
【6h】

基于复杂句式文本情感分类研究

代理获取

目录

第一个书签之前

攻读学位期间发表的学术论文

展开▼

摘要

随着网络的高速发展与开放性不断提高,对网络文本中主观内容的情感倾向性识别成为文本信息处理的研究热点。当今对大数据的研究越来越热,人们对数据分析有了更高的需求,文本表达方式的自由化与多样化等问题会使文本中出现更多的复杂句式从而影响句子级情感分析的结果,目前现有方法针对复杂句式的情感分类准确率欠佳。 本文首先针对中文复杂句的结构特点对多种复杂句进行了详细的情感分析,总结出7种复杂句式,将引导复杂句的关联词归纳为三类,根据对复杂句的分类,总结复杂句匹配模型,提出一种适用复杂句的情感三分类判定规则。 然后本文基于Word2vec词向量模型进行基础情感词典的扩展,将现有情感词典中的情感词选用种子词,获得与种子情感词余弦值较大的词语集,得到已有情感词的相近词。之后对前一步得到的相近情感词运用改进后的语义相似度算法过滤更新近义词集,并收集网络热点词,完成情感词典的构建。情感词典的建立和扩充是文本情感分类研究工作的基础。情感词典的完善对情感分类准确率的提高有很大作用。本文将情感倾向分为褒贬中三类,构建复杂句情感评判规则CSSCM并结合SVM进行训练和预测,对复杂句和随机句分别进行情感分类,并对结果进行比较。同时本文提出多通道可变滤波器动态多池卷积神经网络模型MVDCNN进行情感分类,在卷积层中提取多粒度词语特征,并结合不同词嵌入版本(Word2vec+Glove)预训练词向量,动态多池层利用复杂句式关联词做分割,关联词前后段分别提取最大特征值,不断训练网络进行情感三分类。 实验最后将SVM、CNN、CSSCM、MVDCNN四种模型的情感三分类准确率进行了对比,基于随机句的SVM、CNN、CSSCM、MVDCNN四种模型情感三分类准确率分别达到50.6%,52.0%,53.7%,55.2%。基于复杂句的SVM、CNN、CSSCM、MVDCNN四种模型情感三分类准确率分别达到51.5%,52.8%,54.9%,56.3%。实验结果表明本文提出的CSSCM模型在处理精度方面比传统句子级情感分类方法有了明显的优化,MVDCNN模型进一步提高了情感三分类准确率,获得良好的情感分析效果。实验结果证明了本文提出的方法使复杂句和随机句的情感三分类准确率有不同程度的提高,进一步提高了系统性能,展现出优良的性能。

著录项

  • 作者

    李毅捷;

  • 作者单位

    太原理工大学;

  • 授予单位 太原理工大学;
  • 学科 软件工程
  • 授予学位 硕士
  • 导师姓名 段利国;
  • 年度 2018
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 中等教育;
  • 关键词

    句式; 文本情感;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号