首页> 外文会议>International Workshop on Semantic Evaluation >LIIR at SemEval-2020 Task 12: A Cross-Lingual Augmentation Approach for Multilingual Offensive Language Identification
【24h】

LIIR at SemEval-2020 Task 12: A Cross-Lingual Augmentation Approach for Multilingual Offensive Language Identification

机译:Semeval-2020任务12:一种用于多语言攻击性语言识别的跨语言增强方法

获取原文

摘要

This paper presents our system entitled 'LIIR' for SemEval-2020 Task 12 on Multilingual Offensive Language Identification in Social Media (OffensEval 2). We have participated in Subtask A for English, Danish, Greek, Arabic, and Turkish languages. We adapt and fine-tune the BERT and multilingual Bert models made available by Google AI for English and non-English languages respectively. For the English language, we use a combination of two fine-tuned BERT models. For other languages, we propose a cross-lingual augmentation approach in order to enrich training data and we use multilingual BERT to obtain sentence representations. LIIR achieved rank 14/38, 18/47, 24/86, 24/54, and 25/40 in Greek, Turkish, English, Arabic, and Danish languages, respectively.
机译:本文介绍了我们的系统,为Semeval-2020任务12题为“Liir”,就社交媒体的多语言攻击性语言识别(Offenseval 2)。 我们参加了英语,丹麦语,希腊语,阿拉伯语和土耳其语语言的子任务。 我们适应和微调谷歌AI提供的BERT和多语言BERT模型,分别用于英语和非英语。 对于英语,我们使用两个微调伯特模型的组合。 对于其他语言,我们提出了一种交叉语言增强方法,以丰富培训数据,我们使用多语种伯格来获得句子表示。 李尔分别取得了希腊,土耳其语,英语,阿拉伯语和丹麦语语言的14/38,18 / 47,24 / 86,24 / 47,24 / 80,24/54和25/40。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号