【24h】

L'apport des Entités Nommées pour la classification des opinions minoritaires

机译:命名实体对少数群体意见分类的贡献

获取原文

摘要

La majeure partie des travaux en fouille d'opinion et en analyse de sentiment concerne le classement des opinions majoritaires. Les méthodes d'apprentissage supervisé à base de n-grammes sont souvent employées. Elles ont l'inconvénient d'avoir un biais en faveur des opinions majoritaires si on les utilise de manière classique. En fait la présence d'un terme particulier, fortement associé à la cible de l'opinion dans un document peut parfois suffire à faire basculer le classement de ce document dans la classe de ceux qui expriment une opinion majoritaire sur la cible. C'est un phénomène positif pour l'exactitude globale du classifieur, mais les documents exprimant des opinions minoritaires sont souvent mal classés. Ce point est un problème dans le cas où l'on s'intéresse à la détection des signaux faibles (détection de rumeur) ou pour l'anticipation de renversement de tendance. Nous proposons dans cet article d'améliorer la classification des opinions minoritaires en prenant en compte les Entités Nommées dans le calcul de pondération destiné à corriger le biais en faveur des opinions majoritaires.
机译:意见研究和情绪分析中的大多数工作都与多数意见的排名有关。通常使用基于n-gram的监督学习方法。如果它们以传统方式使用,它们的缺点是倾向于多数意见。实际上,在文档中出现与观点目标紧密相关的特定术语有时足以使该文档的分类属于那些对目标表达多数观点的人。对于分类器的整体准确性,这是一个积极现象,但是表达少数意见的文档经常被错误分类。在人们对微弱信号的检测(谣言的检测)或趋势反转的预期感兴趣的情况下,这是一个问题。在本文中,我们建议通过在加权计算中考虑命名实体来改善少数派意见的分类,以纠正偏爱多数派意见的偏见。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号