Naive Regularizers for Low-Resource Neural Machine Translation

机译：低资源神经机翻译的天真常规

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

Neural machine translation models have little inductive bias, which can be a disadvantage in low-resource scenarios. They require large volumes of data and often perform poorly when limited data is available. We show that using naive regular-ization methods, based on sentence length, punctuation and word frequencies, to penalize translations that are very different from the input sentences, consistently improves the translation quality across multiple low-resource languages. We experiment with 12 language pairs, varying the training data size between 17k to 230k sentence pairs. Our best regularizer achieves an average increase of 1.5 BLEU score and 1.0 TER score across all the language pairs. For example, we achieve a BLEU score of 26.70 on the IWSLT15 English—Vietnamese translation task simply by using relative differences in punctuation as a regularizer.

机译：神经电机翻译模型具有很小的感应偏差，这可能是低资源场景的缺点。它们需要大量数据，并且当有限数据可用时经常执行差。我们表明，使用Naive常规方法，基于句子长度，标点符号和字频率，惩罚与输入句子截然不同的翻译，始终如一地提高多种低资源语言的翻译质量。我们试验12对语言对，改变17K至230K句子对之间的培训数据大小。我们最好的规则器实现平均增加1.5 BLEU评分和所有语言对的1.0倍。例如，我们在IWSLT15英语 - 越南翻译任务中实现了26.70的Bleu得分，只需使用标点符号作为常规器的相对差异。

著录项

来源
《International conference on recent advances in natural language processing》|2019年|xx 702 p.|共10页
会议地点
作者
Meriem Beloucif; Ana Valeria Gonzalez; Marcel Bollmann; Anders S?gaard;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类程序设计、软件工程;
关键词

相似文献

外文文献
中文文献
专利

1. A Joint Back-Translation and Transfer Learning Method for Low-Resource Neural Machine Translation [J] . Gong-Xu Luo, Ya-Ting Yang, Rui Dong, Mathematical Problems in Engineering: Theory, Methods and Applications . 2020,第1期

机译：低资源神经电机翻译的联合背翻译与转移学习方法
2. Impact of Filtering Generated Pseudo Bilingual Texts in Low-Resource Neural Machine Translation Enhancement: The Case of Persian-Spanish [J] . Benyamin Ahmadnia, Bonnie J. Dorr, Raul Aranovich Procedia Computer Science . 2021,第a期

机译：滤波产生的伪双语文本在低资源神经机翻译增强中的影响：波斯语西班牙语的情况
3. Pseudotext Injection and Advance Filtering of Low-Resource Corpus for Neural Machine Translation [J] . Michael Adjeisah, Guohua Liu, Douglas Omwenga Nyabuga, Computational intelligence and neuroscience . 2021,第a期

机译：神经电机翻译低资源语料的假义注射和预先滤波
4. Naive Regularizers for Low-Resource Neural Machine Translation [C] . Meriem Beloucif, Ana Valeria Gonzalez, Marcel Bollmann, International conference on recent advances in natural language processing . 2019

机译：低资源神经机器翻译的幼稚正则化器
5. Turkic Interlingua: A Case Study of Machine Translation in Low-Resource Languages [D] . Mirzakhalov, Jamshidbek. 2021

机译：Turikic Interlingua：一种低资源语言机器翻译的案例研究
6. Pseudotext Injection and Advance Filtering of Low-Resource Corpus for Neural Machine Translation [O] . Michael Adjeisah, Guohua Liu, Douglas Omwenga Nyabuga, 2021

机译：神经电机翻译低资源语料的假义注射和预先滤波
7. Neural Machine Translation of Low-Resource and Similar Languages with Backtranslation [O] . Michael Przystupa, Muhammad Abdul-Mageed 2019

机译：用反向翻译的低资源和类似语言的神经机翻译

Naive Regularizers for Low-Resource Neural Machine Translation

摘要

著录项

相似文献

相关主题

期刊订阅