首页> 外文会议>International Workshop on Semantic Evaluation >Galileo at SemEval-2020 Task 12: Multi-lingual Learning for Offensive Language Identification using Pre-trained Language Models
【24h】

Galileo at SemEval-2020 Task 12: Multi-lingual Learning for Offensive Language Identification using Pre-trained Language Models

机译:伽利略在Semeval-2020任务12:多语言学习使用预先训练的语言模型进行攻击性语言识别

获取原文

摘要

This paper describes Galileo's performance in SemEval-2020 Task 12 on detecting and categorizing offensive language in social media. For Offensive Language Identification, we proposed a multi-lingual method using Pre-trained Language Models, ERNIE and XLM-R. For offensive language categorization, we proposed a knowledge distillation method trained on soft labels generated by several supervised models. Our team participated in all three sub-tasks. In Sub-task A -Offensive Language Identification, we ranked first in terms of average Fl scores in all languages. We are also the only team which ranked among the top three across all languages. We also took the first place in Sub-task B - Automatic Categorization of Offense Types and Sub-task C - Offence Target Identification.
机译:本文介绍了伽利略在Semeval-2020任务12中的性能,在社交媒体中检测和分类攻击性语言。 对于令人反感的语言识别,我们提出了一种使用预先训练的语言模型,ernie和xlm-r的多语言方法。 对于令人反感的语言分类,我们提出了一种知识蒸馏方法,这些方法培训了由多个监督模型产生的软标签。 我们的团队参加了所有三个子任务。 在子任务中,我们在所有语言中的平均流行评分中排名第一。 我们也是唯一一个在所有语言中排名前三个的团队。 我们还介绍了子任务B的第一名 - 自动分类进攻类型和子任务C - 冒犯目标识别。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号