【24h】

Portuguese Native Language Identification

机译:葡萄牙语母语识别

获取原文

摘要

This study presents the first Native Language Identification (NLI) study for L2 Portuguese. We used a sub-set of the NLI-PT dataset, containing texts written by speakers of five different native languages: Chinese, English, German, Italian, and Spanish. We explore the linguistic annotations available in NLI-PT to extract a range of (morpho-)syntactic features and apply NLI classification methods to predict the native language of the authors. The best results were obtained using an ensemble combination of the features, achieving 54.1% accuracy.
机译:这项研究是针对L2葡萄牙语的第一个母语识别(NLI)研究。我们使用了NLI-PT数据集​​的子集,该子集包含由五种不同母语的用户编写的文本:中文,英语,德语,意大利语和西班牙语。我们探索了NL​​I-PT中可用的语言注释,以提取一系列(形态)句法特征,并应用NLI分类方法来预测作者的母语。使用这些功能的组合可获得最佳结果,达到54.1%的准确度。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号