首页> 中文学位 >领域间适应性情感分类方法研究
【6h】

领域间适应性情感分类方法研究

代理获取

摘要

随着Internet的迅速发展与普及,网络上出现了越来越多的主观性言论。对于这些主观性文本的分析和挖掘,传统的基于主题的文本分类方法已经无法满足需求。因此,人们开始关注并研究这些主观性文本的情感分类。
   情感分类是一个领域相关问题,在一个领域训练的分类模型通常很难应用于另一个领域。如果针对每个领域都训练一个分类模型需要大量的标注数据。而标注数据的获得,需要耗费大量的时间和精力,代价非常高昂。因此,领域适应情感分类的研究具有很重要的应用价值。
   针对领域适应性情感分类,本文的主要研究和贡献如下:
   (1)针对不同领域特征统计分布的差异,提出了一种新的结合特征相似度计算的领域间特征选择方法,通过这种方法可以选择出在两个领域中具有相似统计分布的情感特征,从而提高了分类效果。
   (2)提出了基于质心迁移的领域问情感分类方法,该方法利用源领域的标注文本对目标领域的大量未标注文本进行分类,选择一部分可信度高的文本加入到训练集,同时去除源领域中距离目标领域测试集质心较远的文本,通过迭代逐渐缩小两个领域间的质心距离,减小领域间差异。实验表明,该方法能够显著提高分类的效果。
   (3)由于同一领域内文本可能具有不同的特征,而不同领域的文本也可能具有一定相似的特征,本文提出将两个领域的文本进行聚类,针对每个小类中的测试文本分别进行分类的方法。这种方法同样能够减少领域间的差异,提高分类的效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号