首页> 中文学位 >基于潜在语义分析和最大熵的中文情感分析研究
【6h】

基于潜在语义分析和最大熵的中文情感分析研究

代理获取

目录

展开▼

摘要

目前微博、论坛、贴吧等已经成为人们发表意见、表达情感的重要渠道,这些渠道产生的大量情感信息反映了人们对热点事件、话题的褒贬态度。因此,对这些情感信息进行挖掘和分析能够更好地分析热点舆情,了解大众的观点,给政府、企业等提供重要的决策依据。传统的信息检索技术,大多以关键词为基础,无法对这种需求提供很好的支持;而传统的信息抽取和文本分类技术也均未涉及深层次的语义理解,常常不能很好地挖掘和分析情感信息。文本情感分析从情感的角度对带有情感色彩的主观性文本进分析,能更快地从海量信息中发现网络中新的热点话题、突发性事件,把握社会的舆论导向。它是传统话题发现与跟踪研究的拓展和深化,并为文本分类、信息抽取、自动摘要等提供了新的思路和方法,在企业智能分析、政府舆情分析、信息安全和自动文摘等领域具有广阔的应用空间和发展前景。   情感倾向分析研究的涉及面很广,本文着重对其中情感词、句的识别和分类的关键技术进行了深入的研究。本文首先对文本情感倾向分析的国内外现状进行了介绍。其次,本文提出了基于潜在语义分析和最大熵模型的情感词识别及褒贬分析方法,其主要思想是利用潜在语义分析方法,计算情感词与人工选择的褒贬基准词的相似度,并结合多种情感词特征函数建立最大熵情感词识别模型。本文在情感词识别的基础上提出了一种融合多种特征的中文情感句倾向性分类方法。最后,对情感词、句识别模型进行了实验验证,选取第一届中文倾向性分析测评数据(COAE2008)中935篇中文文档测试,情感词褒贬分类得到83.5%的准确率及79.3%的召回率,情感句褒贬分类得到76.8%的准确率及78.3%的召回率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号