首页> 中文学位 >基于多元特征融合和LSTM神经网络的中文评论情感分析
【6h】

基于多元特征融合和LSTM神经网络的中文评论情感分析

代理获取

目录

声明

第一章 绪论

1.1 研究背景和意义

1.2 国内外研究现状

1.3 研究内容介绍

1.4 文本的组织结构

第二章 文本情感分析的相关技术

2.1 文本情感分析任务介绍

2.2 文本预处理

2.3 基于规则的情感分析方法

2.4 基于机器学习的情感分析方法

2.5 基于深度神经网络的情感分析方法

第三章 基于权重分配的多元特征词向量的构建

3.1 文本的表示方法

3.2 引入情感特征的文本表示方法

3.3 引入权重信息的文本表示方法

第四章 基于LSTM神经网络的评论文本情感分析

4.1 RNN模型

4.2 LSTM神经网络模型

4.3 基于LSTM神经网络模型的情感分析方法

4.4 实验设计与实验结果分析

第五章 总结与展望

参考文献

致谢

攻读硕士学位期间发表的学术论文目录

展开▼

摘要

随着移动互联网的飞速发展,网购成了人们日常生活的一部分。电商网站上存在大量的产品评论信息。挖掘这些评论的情感倾向不仅可以为商家提供商品的各种信息,方便商家做出销售决策,也有利于买家对商品做出客观判断,从而做出购买决策。面对数量庞大的评论文本信息,仅靠人工浏览去获取评论的情感倾向费时且费力,如何利用人工智能领域中的相关技术对产品评论自动化地进行情感分析成为了一个重要且有意义的课题。现有的情感分析方法主要有基于规则的方法、基于机器学习的方法和基于深度神经网络的方法,随着大数据技术的发展以及语言的形式越来越多元化,深度神经网络技术成为了自然语言处理领域的主流技术,在情感分析领域也取得了很大的突破,本文主要研究基于深度神经网络的情感分析方法。  本研究主要内容包括:⑴针对文本情感分析中对文本表示时遇到的维度过高和语义不相关的问题,本文采用word embedding机制,通过神经网络语言模型对大量评论文本进行训练,并在此基础上通过distributed representation的方式表示文本,从而将文本映射为一个低维实数向量。这种文本表示方法同时也可以表达文本的语义信息,有助于神经网络模型对文本更好地理解。⑵针对情感分析任务的特殊性,本文提出了一种新的文本表示方法----多元特征词向量。这种表示方法是对distributed representation表示方法的优化。考虑到情感分析中含有情感要素的词对文本整体情感极性的影响,通过构建情感要素词典捕捉文本中含有情感要素的词,并通过构造词的情感特征向量来表达词的情感要素,接着与用distributed representation方式表示的词向量进行特征融合构成多元特征词向量。用多元特征词向量表示的文本不仅含有文本的语义信息,而且可以捕捉文本的情感特征,更适合情感分析任务。⑶情感分析的本质是一个分类问题,计算特征权重是分类问题的重要步骤,基于此理论,本文在提出的多元特征词向量的基础上,进一步对其优化,借鉴特征权重算法为多元特征词向量分配权重,从而突出对分类更重要的词。提出的基于权重分配的多元特征词向量的文本表示方法对传统的文本表示方法从两方面进行了改进,丰富了对文本语义的表达,将其作为神经网络分类模型的输入,更适合神经网络模型对文本进行深层次特征捕捉与情感分类。⑷使用LSTM神经网络模型挖掘文本的深层特征。用基于权重分配的多元特征词向量表示文本,并作为LSTM神经网络模型的输入,然后利用LSTM神经网络能够学习文本中远距离依赖的特性捕捉文本的序列特征及上下文的依赖关系。最后本文通过和传统的基于LSTM神经网络的情感分析方法做对比实验,验证本文提出的改进方案的有效性。

著录项

  • 作者

    李科;

  • 作者单位

    太原理工大学;

  • 授予单位 太原理工大学;
  • 学科 计算机技术
  • 授予学位 硕士
  • 导师姓名 张兴忠;
  • 年度 2017
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

    网络服务,数据挖掘,语义分析,程序语言;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号