首页> 中文学位 >基于LSTM情感分析模型的微博谣言识别方法研究
【6h】

基于LSTM情感分析模型的微博谣言识别方法研究

代理获取

目录

声明

摘要

第一章 绪论

1.1 研究背景和意义

1.2 国内外研究现状

1.2.1 谣言研究的发展

1.2.2 谣言的传播分析

1.2.3 微博谣言识别的研究现状

1.3 本文的主要研究内容

1.4 本文的组织结构

1.5 本章小结

第二章 相关技术研究综述

2.1 谣言的相关介绍

2.1.1 传统生活谣言与现代网络谣言

2.1.2 微博谣言的相关特征

2.2 微博谣言识别的主要任务

2.3 传统机器学习的相关方法

2.3.1 基于有监督的机器学习方法

2.3.2 基于半监督的机器学习方法

2.4 神经网络与深度学习的相关算法

2.4.1 传统神经网络

2.4.2 卷积神经网络

2.4.3 循环神经网络

2.5 本章小结

第三章 基于情感分析的微博谣言识别研究

3.1 微博文本来源可信度的界定

3.1.1 可信度的理论依据

3.1.2 微博文本来源可信度高低的界定方法

3.2 微博数据的采集与语料库的构建

3.2.1 基于徽博API的采集方法

3.2.2 基于爬虫技术的采集方法

3.2.3 微博语料库的构建

3.3 微博谣言识别的方法

3.3.1 文本预处理

3.3.2 微博评论的情感分析

3.3.3 微博传播的模拟方法

3.4 基于LSTM情感分析的谣言识别模型

3.4.1 模型的提出

3.4.2 基于LSTM的情感分析

3.4.3 谣言识别模型的构建

3.5 本章小结

4.1 评价标准

4.2 数据集和处理策略

4.3 实验结果与对比分析

4.3.1 预训练词向量对实验结果的影响

4.3.2 情感差异值对实验结果的影响

4.3.3 加入的特征对实验结果的影响

4.3.4 不同模型的效果对比

4.4 本章小结

5.1 总结

5.2 展望

参考文献

攻读硕士学位期间参加的科研项目与取得的科研成果

致谢

展开▼

摘要

微博是一个开放性和自由度比较高的互联网社交平台,人人都可以在上面发布和接收信息,由于微博信息体量的庞大以及极低的准入机制,给信息的交流带来了巨大的便利,同时也存在着大量的谣言。谣言产生与传播带来的负面效应,极大影响了国家、社会的和谐稳定和个人生活,因此如何能自动有效地识别出微博谣言,一直是相关领域的一个研究热点。
  传统的微博谣言识别研究主要被看作一个有监督学习过程的二分类问题,其工作重点在于相关特征的选择上,主要有基于情感词典的微博情感、用户属性等浅层次的特征,更深层次的特征并没有得到充分挖掘,如微博发布来源的可信度,微博评论的情感倾向以及微博传播的结构特点等,因而谣言识别的效果有限。基于此,本文分析了微博谣言从产生经传播最后到信息接收者面前的全过程,提出了一种基于深度学习LSTM模型的谣言识别策略,用于微博特定主题的谣言识别,具体工作如下:
  首先,本文提出了一种微博来源的可信度高低的界定方法。由于目前对于谣言的来源缺乏有效的鉴定和追本溯源的手段,本文从微博谣言产生的源头入手,根据发布微博的用户特征,给不同特征赋予可信度权值,构建界定微博发布来源可信度高低的方法。然后从微博社区公布的不实信息中采集特定主题的谣言信息,并采集其发布者信息以及评论和转发信息作为谣言集,同时采集正常微博对应的相关信息作为非谣言集,共同构成本文实验的样本集。
  其次,针对微博的相关评论和传播等深层特征,本文使用基于情感词典的方法来获得评论的情感特征,通过构建树形结构来模拟微博的传播结构,然后使用基于高斯核函数的支持向量机来训练模拟数据,从而得到谣言和非谣言微博不同的传播特征,然后将上述特征加入到谣言识别模型中,以提高谣言识别的准确度。
  最后,由于大量微博谣言具有明显的情感倾向,本文采用LSTM模型对微博文本进行情感分析,构建基于LSTM情感分析的微博谣言识别模型,通过对比高低可信度来源的微博语料在情感倾向上产生的冲突和差异,同时加入微博评论和传播特征来识别谣言。实验证明,上述方法对微博谣言具有较好的识别效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号