首页> 中文学位 >基于语义特征的微博情感分析的研究
【6h】

基于语义特征的微博情感分析的研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章 绪论

1.1 研究背景、目的和意义

1.2 国内外研究现状

1.3 存在的问题

1.4 本文的创新工作

1.5 本文组织结构

第2章 文本相关技术研究

2.1 相关术语的介绍

2.2 短文本的研究

2.3 文本分类的方法

2.4 交叉验证

2.5 微博情感分析的框架

2.6 本章小结

第3章 词典的构建

3.1 情感词典的相关介绍

3.2 词典建立过程中工具的介绍和选择

3.3情感词典的构建

3.4 情感词典的优化

3.5 其它词典的构建

3.6 本章小结

第4章 基于SVM的微博情感分析

4.1 支持向量机简介

4.2 情感分析中工具的介绍和选择

4.3 微博情感分析的处理流程

4.4 实验数据的处理

4.5 特征选择

4.6 训练和测试分类模型

4.7 本章小结

第5章 实验结果和分析

5.1 实验环境

5.2 特征选择对比实验

5.3 情感词典对比实验

5.4 不同算法的对比实验

5.5 本章小结

结论

参考文献

致谢

展开▼

摘要

微博的共享性和实时性,不仅使微博平台拥有庞大的用户群,而且产生了海量的微博数据信息,微博的内容涵盖了教育、经济、科技、文化等话题。处理和分析微博数据可以挖掘微博中隐藏的社会价值和经济效益,及时了解广大网民对某产品、人物或者事件的关注程度和情感变化,为决策者提供实时科学的理论依据。基于微博的情感分析是情感分析领域的研究热点,同样也是自然语言处理领域热点的问题之一。
  微博的情感分析还处于初级阶段,在实际应用中只局限在很小的范围之内,因此情感分析的研究还有待继续深入。目前,最常用的情感分析的方法是基于情感词典和规则的方法以及基于机器学习的方法。基于情感词典的方法中情感词语决定了微博的情感倾向性,必须构造一部完善的情感词典才能处理大规模的微博数据,但是目前还没有有效的构造情感词典的方法。基于机器学习的方法需要对微博进行特征选择,但是目前没有有效的特征能够表示微博。
  针对在微博情感分析中没有有效的构造情感词典的方法的问题,本文提出基于《同义词词林》和微博索引系统的情感词典的构造方法。本文利用《同义词词林》对四部基础情感词典进行扩展形成一部较完善的词典,构造了千万级别的微博索引系统,利用PMI公式计算情感词语的情感倾向值。针对情感分析中特征选择的问题,本文利用包括情感词典在内不同的特征组合通过对比实验选取了有效的特征组合。
  实验证明,本文中构造的情感词典比较完备,相对于四部基础情感词典能有效提升微博情感分析的性能。本文中所使用的特征组合在微博的情感分析中有效,能够解决机器学习中特征选择的问题。
  本文的研究成果提升情感词典质量和弥补了特征选择中的不足,为微博的情感分析提供了新的方法和解决思路。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号