首页> 外文会议>Traitement automatique des langues naturelles >Adaptation thématique pour la traduction automatique de dépêches de presse
【24h】

Adaptation thématique pour la traduction automatique de dépêches de presse

机译:自动翻译新闻报道的主题改编

获取原文

摘要

L'utilisation de méthodes statistiques en traduction automatique (TA) implique l'exploitation de gros corpus parallèles représentatifs de la tâche de traduction visée. La relative rareté de ces ressources fait que la question de l'adaptation au domaine est une problématique centrale en TA. Dans cet article, une étude portant sur l'adaptation thématique des données journalistiques issues d'une même source est proposée. Dans notre approche, chaque phrase d'un document est traduite avec le système de traduction approprié (c.-à-d. spécifique au thème dominant dans la phrase). Deux scénarios de traduction sont étudiés : (a) une classification manuelle, reposant sur la codification IPTC ; (b) une classification automatique. Nos expériences montrent que le scénario (b) conduit à des meilleures performances (à l'aune des métriques automatiques), que le scénario (a). L'approche la meilleure pour la métrique BLEU semble toutefois consister à ne pas réaliser d'adaptation ; on observe toutefois qu'adapter permet de lever certaines ambiguïtés sémantiques.
机译:机器翻译(MT)中统计方法的使用涉及代表目标翻译任务的大型并行语料库的使用。这些资源的相对稀缺意味着适应田野的问题是技术援助中的中心问题。在本文中,对来自同一来源的新闻数据的主题适应性进行了研究。在我们的方法中,文档的每个句子都使用适当的翻译系统进行翻译(即特定于句子中的主要主题)。研究了两种翻译方案:(a)基于IPTC编纂的手动分类; (二)自动分类。我们的经验表明,场景(b)比场景(a)带来更好的性能(就自动指标而言)。但是,对于BLUE度量标准,最好的方法似乎是不执行调整。但是,我们发现,适应使消除某些语义歧义成为可能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号