首页> 外文会议>International workshop on semantic evaluation >CodeX: Combining an SVM Classifier and Character N-gram Language Models for Sentiment Analysis on Twitter Text
【24h】

CodeX: Combining an SVM Classifier and Character N-gram Language Models for Sentiment Analysis on Twitter Text

机译:Codex:在Twitter文本中结合SVM分类器和字符N-GRAM语言模型进行情感分析

获取原文

摘要

This paper briefly reports our system for the SemEval-2013 Task 2: sentiment analysis in Twitter. We first used an SVM classifier with a wide range of features, including bag of word features (unigram, bigram), POS features, stylistic features, readability scores and other statistics of the tweet being analyzed, domain names, abbreviations, emoticons in the Twitter text. Then we investigated the effectiveness of these features. We also used character n-gram language models to address the problem of high lexical variation in Twitter text and combined the two approaches to obtain the final results. Our system is robust and achieves good performance on the Twitter test data as well as the SMS test data.
机译:本文简要介绍了Semeval-2013任务2:Twitter中的情感分析。我们首先使用具有广泛功能的SVM分类器,包括单词特征(Unigram,Bigram),POS功能,文体特征,可读性分数以及正在分析的推文的其他统计数据,域名,缩写,Twitter中的表情符号文本。然后我们调查了这些特征的有效性。我们还使用了字符N-GRAM语言模型来解决Twitter文本中高词汇变化的问题,并组合两种方法以获得最终结果。我们的系统具有强大,在Twitter测试数据以及SMS测试数据上实现了良好的性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号