首页> 中文期刊>山西大学学报(自然科学版) >中文微博情感倾向性分析特征工程

中文微博情感倾向性分析特征工程

     

摘要

情感倾向性分析是情感分析的重要组成部分,是一种按照情感倾向对文本进行分类的任务.微博与传统的评论文本相比更加口语化与符号化,因此对微博进行情感倾向性分析是一个非常有挑战性的任务.基于机器学习的方法是情感倾向性分析最经典的算法,核心是要进行特征的分析和选择,例如词袋特征等.然而,由于中文语言的独特性,前人很多有效的特征都是语言相关的,将其直接用于中文微博效果不佳.在中文微博语料上,还没有学者进行细致的特征工程建设.基于此,文章综合国内外诸多特征,并考虑到中文的独特性,对中文微博的褒贬中倾向性判别特征工程的词、词组、数值和句法特征分别进行了研究,并提出了基于词典规则的情感评分的新特征.最后经过大量实验与分析,得出了可靠的特征组合.实验结果表明,此方法能够明显提高情感倾向性分析的结果.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号