序列-序列模型注意力机制模块基本原理探究

马春鹏; 赵铁军

首页> 中文期刊> 《智能计算机与应用》 >序列-序列模型注意力机制模块基本原理探究

序列-序列模型注意力机制模块基本原理探究

AI论文写作 >>

开具论文收录证明 >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

编码器-解码器注意力矩阵一直都被认为是传统的神经机器翻译模型(例如基于循环神经网络的模型)学习到的词对齐。然而,通过实验证明了,对于Transformer这一结论并不成立。通过比较Transformer与基于循环神经网络的模型,研究发现了2种模型中注意力机制的本质上的2个区别。基于这个观察,提出了2种能够让Transformer的注意力机制学习到词对齐的方法。实验结果证明了本文提出的方法的有效性,可使Transformer既能学习到很好的词对齐,也能够提升机器翻译的性能。

著录项

来源
《智能计算机与应用》 |2020年第1期|P.1-6|共6页
作者
马春鹏; 赵铁军;
展开▼
作者单位

哈尔滨工业大学计算机科学与技术学院哈尔滨150001;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
序列-序列模型; 词对齐; Transformer;

相似文献

中文文献
外文文献
专利

1. 序列-序列模型注意力机制模块基本原理探究 [J] . 马春鹏 ,赵铁军 . 智能计算机与应用 . 2020,第001期
2. 基于多尺度与改进注意力机制的序列到序列模型 [J] . 陈立 ,朱丙丽 . 计算机应用与软件 . 2020,第012期
3. 融合自注意力机制与长短期偏好的序列推荐模型 [J] . 沈学利 ,杜志伟 . 计算机应用研究 . 2021,第005期
4. 基于注意力机制的特征融合序列标注模型 [J] . 王旭强 ,岳顺民 ,张亚行 . 山东科技大学学报（自然科学版） . 2020,第005期
5. 一种基于序列到序列模型的时间序列插补 [J] . 周茜 ,向维 . 北京信息科技大学学报（自然科学版） . 2021,第003期
6. 基于序列到序列模型的法律问题关键词抽取 [C] . Daojian Zeng ,曾道建 ,Guowei Tong . 第十七届全国计算语言学学术会议暨第六届基于自然标注大数据的自然语言处理国际学术研讨会（CCL 2018） . 2018
7. 基于注意力机制与神经网络结合的时间序列模型研究及应用 [A] . 高堰泸 . 2021

序列-序列模型注意力机制模块基本原理探究

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅