【24h】

Combination of Arabic Preprocessing Schemes for Statistical Machine Translation

机译:结合阿拉伯语预处理方案进行统计机器翻译

获取原文
获取原文并翻译 | 示例

摘要

Statistical machine translation is quite robust when it comes to the choice of input representation. It only requires consistency between training and testing. As a result, there is a wide range of possible preprocessing choices for data used in statistical machine translation. This is even more so for morphologically rich languages such as Arabic. In this paper, we study the effect of different word-level preprocessing schemes for Arabic on the quality of phrase-based statistical machine translation. We also present and evaluate different methods for combining preprocessing schemes resulting in improved translation quality.
机译:在选择输入表示形式时,统计机器翻译非常强大。它只要求培训和测试之间保持一致。因此,对于统计机器翻译中使用的数据,存在多种可能的预处理选择。对于形态丰富的语言(例如阿拉伯语)而言,情况更是如此。在本文中,我们研究了阿拉伯语不同单词级预处理方案对基于短语的统计机器翻译质量的影响。我们还将介绍和评估用于组合预处理方案的不同方法,从而提高翻译质量。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号