首页> 中文学位 >面向中文微博的情感信息抽取方法研究
【6h】

面向中文微博的情感信息抽取方法研究

代理获取

目录

声明

摘要

第1章 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.2.1 情感信息概述

1.2.2 情感信息抽取方法的研究现状

1.2.3 中文微博的情感信息抽取方法

1.3 本文的研究内容

1.4 论文组织结构

第2章 中文微博评价对象候选集的构建

2.1 中文微博

2.1.1 中文微博的特点

2.1.2 中文微博文本预处理

2.2 评价对象候选集的概述

2.3 候选评价对象构建方法

2.3.1 句法分析

2.3.2 基于句法分析的候选评价对象构建方法

2.4 实验结果及分析

2.4.1 实验数据集

2.4.2 实验工具及语义资源

2.4.3 构建评价对象候选集的实验结果及分析

2.5 本章小结

第3章 中文微博候选评价对象的筛选

3.1 筛选方法的概述

3.2 基于SVM的候选评价对象筛选方法

3.2.1 SVM分类器

3.2.2 语义角色标注

3.2.3 特征的选取

3.2.4 模型参数的训练

3.3 基于加权模型的候选评价对象筛选方法

3.4 基于CRF的候选评价对象筛选方法

3.4.1 CRFs

3.4.2 特征的选取

3.4.3 特征模板的设计

3.4.4 基于CRF的筛选流程

3.5 实验结果及分析

3.5.1 筛选数据集及其构建

3.5.2 实验工具及语义资源

3.5.3 K倍交叉验证法

3.5.4 基于SVM的候选评价对象筛选方法实验结果及分析

3.5.5 基于加权模型的候选评价对象筛选方法实验结果及分析

3.5.6 基于CRF的候选评价对象筛选方法实验结果及分析

3.5.7 筛选方法的对比实验结果及分析

3.6 本章小结

第4章 评价对象的极性判别

4.1 评价对象的极性判别概述

4.2 极性判别的分类器构建

4.2.1 分类器的选择

4.2.2 朴素贝叶斯分类器

4.2.3 基于朴素贝叶斯的情感极性分类

4.3 实验结果及分析

4.3.1 实验数据

4.3.2 实验工具及语义资源

4.3.3 基于朴素贝叶斯的情感极性分类方法实验结果及分析

4.3.4 评价对象的极性判别方法实验结果及分析

4.4 本章小结

第5章 中文微博情感信息抽取系统的设计与实现

5.1 系统框架设计

5.2 系统的实现

5.2.1 编程语言的选择

5.2.2 系统的运行

5.2.3 系统的主要功能

5.3 本章小结

第6章 总结与展望

6.1 本文工作总结

6.2 下一步工作展望

参考文献

个人简历及在学期间发表的论文与研究成果

致谢

展开▼

摘要

随着互联网的广泛普及,网络已经成为人们获取信息、共享信息的主要途径。微博作为一种新兴的互动交流平台,也逐渐成为人们网络生活的一部分,面向微博文本的相关研究受到越来越多学者的关注。面向微博的情感分析是微博相关文本分析中的一个重要的课题,而中文微博的情感信息抽取作为中文微博情感分析的基础任务,受到研究者的广泛关注,逐渐成为一个热门的研究方向。
  中文微博的情感信息抽取的目的在于将无结构的情感文本转换成有结构的文本——情感信息单元,不但可以直接应用于用户评论分析与决策等方面,而且可以服务于其它情感分析任务,如文本情感分类。其中情感信息单元包括评价对象、评价词语、极性及观点持有者四个元素。然而,由于微博文本语言表达随意,大多数微博文本的句法结构都是不完整的,且具有大量的冗余信息和网络词汇,采用原有文本意见挖掘方法进行抽取信息的效果并不理想。因此需要结合微博自身特点,对现有技术进行改进以便抽取微博情感信息,主要研究内容包括以下几个方面:
  (1)中文微博评价对象候选集的构建。结合中文微博文本的特点,对微博文本进行预处理,利用句法分析获取名词短语,对名词短语进行后处理,再构建包括名词、名词短语以及微博话题在内的评价对象候选集,并对该步骤的实验结果进行分析。
  (2)中文微博候选评价对象的筛选。采用3种策略实现候选评价对象的筛选:首先,采用SVM模型筛选候选评价对象,通过采用语义角色信息、最小距离和词频三个特征,实现SVM模型分类器对候选评价对象进行筛选;其次,采用加权模型筛选候选评价对象,根据不同特征,计算候选评价对象的权重分数,从而判别其是否为正确的评价对象。最后,基于CRF模型善于解决序列标注问题的特点,引入常用的情感信息抽取特征,以及情感词、语义角色标注等特征,采用CRF模型对候选评价对象进行筛选。
  (3)评价对象的极性判别。若评价对象附近存在情感词,则寻找距离评价对象最近的情感词,根据情感词表,判断评价对象的情感极性;若评价对象附近不存在情感词,则用微博句子的情感极性代替评价对象的情感极性,其中微博句子的情感极性通过朴素贝叶斯分类器得到。
  (4)综上研究内容,设计并实现了中文微博情感信息抽取系统。该系统可用于对评价对象候选集的构建方法、候选评价对象的筛选方法以及极性判别方法进行实验结果分析,也可实际用于情感信息的抽取任务。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号