基于跨语种预训练语言模型XLM-R的神经机器翻译方法

王倩; 李茂西; 吴水秀; 王明文

首页> 中文期刊>北京大学学报:自然科学版 >基于跨语种预训练语言模型XLM-R的神经机器翻译方法

基于跨语种预训练语言模型XLM-R的神经机器翻译方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

探索将XLM-R跨语种预训练语言模型应用在神经机器翻译的源语言端、目标语言端和两端,提高机器翻译的质量。提出3种网络模型,分别在Transformer神经网络模型的编码器、解码器以及两端同时引入预训练的XLM-R多语种词语表示。在WMT英语-德语、IWSLT英语-葡萄牙语以及英语-越南语等翻译中的实验结果表明,对双语平行语料资源丰富的翻译任务,引入XLM-R可以很好地对源语言句子进行编码,从而提高翻译质量;对双语平行语料资源匮乏的翻译任务,引入XLM-R不仅可以很好地对源语言句子进行编码,还可以对源语言端和目标语言端的知识同时进行补充,提高翻译质量。

著录项

来源
《北京大学学报:自然科学版》|2022年第1期|29-36|共8页
作者
王倩; 李茂西; 吴水秀; 王明文;
展开▼
作者单位

江西师范大学计算机信息工程学院,南昌330022;

展开▼
原文格式 PDF
正文语种 chi
中图分类英语;
关键词
跨语种预训练语言模型; 神经机器翻译; Transformer网络模型; XLM-R模型; 微调;
入库时间 2022-08-21 05:32:14

相似文献

中文文献
外文文献
专利

1. 基于自注意力机制预训练跨蒙汉语言模型 [J] . 苏依拉 ,高芬 ,牛向华 . 计算机应用与软件 . 2021,第002期
2. 基于语种相似性挖掘的神经机器翻译语料库扩充方法 [J] . 李灿 ,杨雅婷 ,马玉鹏 . 计算机应用 . 2021,第011期
3. CPLM-CSC:基于单字级别预训练语言模型的中文错别字纠正方法 [J] . 谢海华 ,李奥林 ,李亚博 . 中文信息学报 . 2021,第005期
4. 基于多语言预训练语言模型的译文质量估计方法 [J] . 陆金梁 ,张家俊 . 厦门大学学报（自然科学版） . 2020,第002期
5. 基于预训练模型的机器翻译译文检测方法 [J] . 田科 ,张家俊 . 情报工程 . 2020,第005期
6. CPLM-CSC:基于单字级别预训练语言模型的中文错别字纠正方法 [C] . Haihua XIE ,谢海华 ,Aolin LI . 第十八届中国计算语言学大会暨中国中文信息学会2019学术年会 . 2018
7. 基于预训练语言模型的自然语言理解方法研究 [A] . 刘涛 . 2021

基于跨语种预训练语言模型XLM-R的神经机器翻译方法

摘要

著录项

相似文献

相关主题

期刊订阅