首页> 外文会议>Workshop on Arabic Natural Language Processing >Machine Learning-Based Approach for Arabic Dialect Identification
【24h】

Machine Learning-Based Approach for Arabic Dialect Identification

机译:基于机器学习的阿拉伯语方言识别方法

获取原文

摘要

This paper describes our systems submitted to the Second Nuanced Arabic Dialect Identification Shared Task (NADI 2021). Dialect identification is the task of automatically detecting the source variety of a given text or speech segment. There are four subtasks, two sub-tasks for country-level identification and the other two subtasks for province-level identification. The data in this task covers a total of 100 provinces from all 21 Arab countries and come from the Twitter domain. The proposed systems depend on five machine-learning approaches namely Complement Naieve Bayes, Support Vector Machine, Decision Tree, Logistic Regression and Random Forest Classifiers. F_1 macro-averaged score of Naieve Bayes classifier outperformed all other classifiers for development and test data.
机译:本文介绍了我们提交给第二个细微患者阿拉伯语方言识别共享任务的系统(NADI 2021)。 方言识别是自动检测给定文本或语音段的源多样的任务。 有四个子任务,国家级别标识的两个子任务以及省级识别的其他两个子任务。 该任务中的数据涵盖了来自所有21个阿拉伯国家的100个省份,并来自Twitter领域。 所提出的系统依赖于五种机器学习方法,即补充贝叶斯,支持向量机,决策树,逻辑回归和随机林分类器。 F_1宏观平均得分明智的贝叶斯分类器优于开发和测试数据的所有其他分类器。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号