首页> 外文会议>IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining >Class Strength V2: An Adaptive Multilingual Tool for Tweet Classification
【24h】

Class Strength V2: An Adaptive Multilingual Tool for Tweet Classification

机译:类强度V2:推文分类的自适应多语言工具

获取原文

摘要

In this paper we present the second version of our multilingual tweet classification tool. ClassStrength v2 classifies tweets into 14 categories (Sports, Music, News&Politics etc.) using a distant supervision approach. The new version extends the initial set of five languages to ten (English, French, German, Chinese, Japanese, Arabic, Russian, Spanish, Portuguese and Polish). In addition, the classification models of each language get automatically updated every month to allow accurate classification over time. Our experimentation showed that the larger the time gap between the tweet and the data used for training the model, the worse the performance, which motivated for creating an adaptive version of ClassStrength that get its models updated periodically.
机译:在本文中,我们提供了我们多语言推文分类工具的第二个版本。 ClassStrength V2使用远程监督方法将推文分类为14个类别(体育,音乐,新闻和政治等)。新版本将最初的五种语言集扩展到十(英语,法语,德语,中文,日语,阿拉伯语,俄语,西班牙语,葡萄牙语和波兰语)。此外,每种语言的分类模型每月都会自动更新,以便随着时间的推移准确分类。我们的实验表明,Tweet之间的时间差距和用于训练模型的数据越大,性能越差,这是为了创建定期更新其型号的自适应版本的分类版本的性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号