首页> 外文会议>Workshop on Speech and Language Technologies for Dravidian Languages >indicnlp@kgp at DravidianLangTech-EACL2021: Offensive Language Identification in Dravidian Languages
【24h】

indicnlp@kgp at DravidianLangTech-EACL2021: Offensive Language Identification in Dravidian Languages

机译:Dravidianlangtech-eacl2021的indicnlp @ kgp:Dravidian语言中的令人反感语言识别

获取原文

摘要

The paper presents the submission of the team indicnlp@kgp to the EACL 2021 shared task "Offensive Language Identification in Dravidian Languages". The task aimed to classify different offensive content types in 3 code-mixed Dravidian language datasets. The work leverages existing state of the art approaches in text classification by incorporating additional data and transfer learning on pre-trained models. Our final submission is an ensemble of an AWD-LSTM based model along with 2 different transformer model architectures based on BERT and RoBERTa. We achieved weighted-average F1 scores of 0.97, 0.77. and 0.72 in the Malayalam-English, Tamil-English, and Kannada-English datasets ranking 1st, 2nd, and 3rd on the respective tasks.
机译:本文介绍了将TeamNingnlp @ KGP提交给EACL 2021共享任务“在Dravidian语言中的冒犯性语言识别”。 该任务旨在在3个代码混合的Dravidian语言数据集中对不同的冒犯内容类型进行分类。 该工作通过在预先训练的模型上结合额外的数据并转移学习,利用文本分类中的现有技术方法。 我们的最终提交是基于AWD-LSTM的模型以及基于BERT和Roberta的2种不同的变压器模型架构。 我们达到了0.97,0.77的加权平均F1分数。 在Malayalam-English,Tamil-English和Kannada-English数据集中排名第1,第2和第3个,在相应的任务中排名第1。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号