【24h】

A hybrid approach to identifying sentiment polarity for new words

机译:识别新单词情感极性的混合方法

获取原文
获取原文并翻译 | 示例

摘要

Microblog is a typical form of heterogeneous information. For this information, identifying sentiment polarity of new words plays a fundamental role in sentiment analysis. In this paper, we proposed a hybrid approach using both statistic and syntax information to identifying the sentiment polarity of new words. We first filter the raw tweets out some noises and segment the clean data with POS tagging. Next, we collect new words by filtering rules. Then, we assign each new word with a polarity using both statistics and patterns information. We evaluate our approach on a real dataset from Sina Weibo, achieving a relatively high F-score of 0.241 compared with the baseline of 0.22.
机译:微博客是异构信息的一种典型形式。对于此信息,识别新单词的情感极性在情感分析中起着基本作用。在本文中,我们提出了一种使用统计信息和语法信息的混合方法来识别新单词的情感极性。我们首先过滤掉原始推文,去除一些噪音,然后使用POS标签分割干净的数据。接下来,我们通过过滤规则来收集新单词。然后,我们使用统计信息和模式信息为每个新单词分配一个极性。我们在新浪微博的真实数据集上评估了我们的方法,与基线的0.22相比,获得了相对较高的F得分0.241。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号