首页> 外文OA文献 >Dialectal to Standard Arabic Paraphrasing to Improve Arabic-English Statistical Machine Translation
【2h】

Dialectal to Standard Arabic Paraphrasing to Improve Arabic-English Statistical Machine Translation

机译:以标准阿拉伯语释义的方言,以改善阿拉伯英语统计机器翻译

摘要

This paper is interested in improving the quality of Arabic-English statistical machine translation (SMT) on highly dialectal Arabic text using morphological knowledge. We present a light-weight rule-based approach to producing Modern Standard Arabic (MSA) paraphrases of dialectal Arabic out-of-vocabulary words and low frequency words. Our approach extends an existing MSA analyzer with a small number of morphological clitics and transfer rules. The generated paraphrase lattices are input to a state-of-the-art phrase-based SMT system resulting in improved BLEU scores on a blind test set by 0.56 absolute BLEU (or 1.5% relative).
机译:本文对利用形态学知识提高高度方言阿拉伯语文本的阿拉伯语-英语统计机器翻译(SMT)的质量感兴趣。我们提出一种轻量级的基于规则的方法来产生方言阿拉伯语词汇和低频词的现代标准阿拉伯语(MSA)释义。我们的方法扩展了现有的MSA分析仪,使其具有少量的形态学气候和传输规则。生成的复述格被输入到最新的基于短语的SMT系统中,从而在盲测试集上将BLEU得分提高了0.56绝对BLEU(或相对于1.5%)。

著录项

  • 作者单位
  • 年度 2011
  • 总页数
  • 原文格式 PDF
  • 正文语种 {"code":"en","name":"English","id":9}
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号