基于简单循环单元的深层神经网络机器翻译模型

张文; 冯洋; 刘群

首页> 中文期刊>中文信息学报 >基于简单循环单元的深层神经网络机器翻译模型

基于简单循环单元的深层神经网络机器翻译模型

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

基于注意力机制的神经网络机器翻译模型已经成为目前主流的翻译模型,在许多翻译方向上均超过了统计机器翻译模型,尤其是在训练语料规模比较大的情况下,优势更加明显。该模型使用编码器—解码器框架,将翻译任务建模成序列到序列的问题。然而,在基于门控循环单元(gated recurrent unit,GRU)的编码器—解码器模型中,随着模型层数的增加,梯度消失的问题使模型难以收敛并且严重退化,进而使翻译性能下降。该文使用了一种简单循环单元(simple recurrent unit,SRU)代替GRU单元,通过堆叠网络层数加深编码器和解码器的结构,提高了神经网络机器翻译模型的性能。我们在德语—英语和维语—汉语翻译任务上进行了实验,实验结果表明,在神经网络机器翻译模型中使用SRU单元,可以有效地解决梯度消失带来的模型难以训练的问题;通过加深模型能够显著地提升系统的翻译性能,同时保证训练速度基本不变。此外,我们还与基于残差连接(residual connections)的神经网络机器翻译模型进行了实验对比,实验结果表明,我们的模型有显著性优势。

著录项

来源
《中文信息学报》|2018年第10期|36-44|共9页
作者
张文; 冯洋; 刘群;
展开▼
作者单位

中国科学院计算技术研究所智能信息处理重点实验室;

中国科学院大学;

都柏林城市大学ADAPT中心计算学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
门控循环单元; 梯度消失; 残差连接; 简单循环单元;

相似文献

中文文献
外文文献
专利

1. 基于卷积神经网络和简单循环单元集成模型的风电场内多风机风速预测 [J] . 王晨 ,寇鹏 . 电工技术学报 . 2020,第013期
2. 基于卷积与双向简单循环单元的文本分类模型 [J] . 陈天龙 ,喻国平 ,姚磊岳 . 计算机工程与设计 . 2020,第003期
3. 基于门循环单元神经网络模型的煤层底板突水动态预测 [J] . 邓强 ,张召千 ,王震 . 太原理工大学学报 . 2021,第005期
4. 基于门控循环单元神经网络的交通流预测模型 [J] . 沈潇 ,李宗花 . 淮阴师范学院学报（自然科学版） . 2021,第001期
5. 基于深度门控循环单元神经网络的短期风功率预测模型 [J] . 牛哲文 ,余泽远 ,李波 . 电力自动化设备 . 2018,第005期
6. 基于子字单元的神经机器翻译未登录词翻译分析 [C] . 韩冬 ,李军辉 ,熊德意 . 第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会 . 2017
7. 结合多尺度残差卷积神经网络和简单循环单元的光学乐谱识别方法研究 [A] . 吴琼 . 2019

基于简单循环单元的深层神经网络机器翻译模型

摘要

著录项

相似文献

相关主题

期刊订阅