首页> 中文学位 >细颗粒度情感分析若干技术研究
【6h】

细颗粒度情感分析若干技术研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪 论

1.1 前言

1.2 “细颗粒度”情感分析概述

1.3 研究内容及贡献

1.4 本文组织

第二章 相关工作

2.1 “细颗粒度”情感倾向分析

2.2 领域适应性

2.3 无监督和有监督方法抽取评价对象

第三章 基于条件随机场的自适应模型抽取评价对象

3.1 前言

3.2 基于条件随机场的评价对象抽取

3.3 适应测试语料的特征建模

3.4 实验与讨论

3.5 本章小结

第四章 联合无监督和有监督方法抽取评价对象

4.1前言

4.2 基于Apriori算法挖掘评价对象

4.3基于条件随机场抽取评价对象

4.4 联合无监督和有监督的方法抽取评价对象

4.5 实验与讨论

4.6 本章小结

第五章 基于规则和统计的评价搭配抽取

5.1 前言

5.2 基于规则和统计的评价对象抽取

5.3 基于评价词词典匹配的评价短语抽取

5.4 基于逻辑回归和规则的搭配关系抽取

5.5 基于支持向量机和规则相结合的情感倾向性判别

5.6 实验与讨论

5.7 本章小结

第六章 总结与展望

6.1本文工作总结

6.2工作展望

参考文献

附录

致谢

展开▼

摘要

随着互联网的迅速普及,网络上面涌现了大量用户评论信息,这些评论信息表达了评论者对于产品或者事物的态度或者看法。对评论信息进行深入挖掘分析,可以为消费者和公司提供相关产品的口碑信息,也可以为政府提供舆情监测分析。在此背景下,情感倾向分析技术研究已经成为近期的研究热点。
  “细颗粒度”情感倾向分析又称评论信息挖掘,是指在给定的文章、段落、句子中挖掘出所需要的评价单元。其研究工作包括评价对象抽取,评价短语抽取,评价搭配关系抽取,评价极性判断等研究内容。“细颗粒度”情感倾向分析存在着严重的跨领域性差问题。本文主要对此问题展开了研究工作,最后设计了一种“细颗粒度”情感倾向分析系统。主要工作内容包括以下三部分:
  (1)针对条件随机场跨领域抽取评价对象性能差的问题,我们提出一种基于图的句子排序算法来提高领域适应性。该方法通过使得训练语料和测试语料的主题最接近,来使得条件随机场能够适应训练语料。我们的方法在COAE2011的语料中三个领域的宏平均F1值可以达到14.91%,相比第三届中文情感分析评测会议(COAE2011)的最好结果9.16%有显著的相对提高。
  (2)针对有监督方法抽取评价对象的跨领域性差问题,我们联合无监督和有监督方法来抽取评价对象。首先给出了无监督和有监督的抽取方案,然后给出了四种联合方案。首先是并集的方案,其次是交集的方案,方案三和方案四是联合训练的方案,方案三是把无监督结果标签作为条件随机场的特征输入来联合训练,方案四是把无监督结果标签作为条件随机场的状态变量来联合训练。实验结果显示,方案三和方案的联合训练方案能够显著提高F1值,特别的,方案三在电子产品领域,方案四在金融证劵领域对于提高F1值的效果更为显著。
  (3)我们总结前人的工作,设计了一种“细颗粒度”情感倾向分析系统。在此系统中,对评价对象识别采用基于规则和统计方法。采用基于词典的方法对评价短语进行抽取。我们使用逻辑回归方法来抽取搭配关系,此外,还结合规则来进行评价搭配关系的补充。对于句子情感倾向性的判断,使用基于支持向量机的判别和相关的规则补充的方法,抽取的特征包括统计特征和语义特征,统计特征是对句子做二元文法,三元文法,四元文法的切分,并且结合特征的2值来进行过滤。对于补充的规则主要是采用基于词典匹配和词性搭配的补充方法。该系统参与了COAE2011会议的实际评测,综合排名中游,评价对象抽取的召回率排名第一。
  本文的工作主要着重于“细颗粒度”情感倾向分析的研究。我们既对跨领域问题进行了细致研究,又总结前人的工作,设计了一种“细颗粒度”情感倾向分析系统。这些方法的研究和所取得的成果将有助于提高跨领域抽取的性能,也有助于提高“细颗粒度”情感分析系统的性能,对今后情感分析领域的研究具有重要的参考价值。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号