【24h】

Annotation automatique d'un corpus d'apprenants d'anglais avec un jeu d'étiquettes modifié du Penn Treebank

机译:使用Penn TreeBank的修改标签进行自动注释英语学习者的语料库

获取原文

摘要

Cet article aborde la problématique de l'annotation automatique d'un corpus d'apprenants d'anglais. L'objectif est de montrer qu'il est possible d'utiliser un étiqueteur PoS pour annoter un corpus d'apprenants afin d'analyser les erreurs faites par les apprenants. Cependant, pour permettre une analyse suffisamment fine, des étiquettes fonctionnelles spécifiques aux phénomènes linguistiques à étudier sont insérées parmi celles de l'étiqueteur. Celui-ci est entra?né avec ce jeu d'étiquettes étendu sur un corpus de natifs avant d'être appliqué sur le corpus d'apprenants. Dans cette expérience, on s'intéresse aux usages erronés de this et that par les apprenants. On montre comment l'ajout d'une couche fonctionnelle sous forme de nouvelles étiquettes pour ces deux formes, permet de discriminer des usages variables chez les natifs et non-natifs et, partant, d'identifier des schémas incorrects d'utilisation. Les étiquettes fonctionnelles éclairent sur le fonctionnement discursif.
机译:本文涉及英语学习者的自动注释问题。目标是表明,可以使用POS栏杆诠释学习者语料库来分析学习者所做的错误。然而,为了允许足够精细的分析,将学习的语言现象特异的功能标签插入莱克斯特的那些。这一组标签已经进入了当地人的语料库之前,在应用于学习者的语料库之前。在这个实验中,我们对这个问题的错误用途和学习者感兴趣。示出了如何为这两种形式的新标签的形式添加功能层,使得可以在本机和非本机中辨别可变使用,并且因此识别不正确的使用方案。功能标签照亮话语操作。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号