基于最长名词短语处理的汉蒙神经网络机器翻译模型

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

近年来，深度学习方法的研究成为热点，神经网络机器翻译成为机器翻译研究的重要方向。汉蒙机器翻译也因此取得了极大地进步。然而，汉蒙翻译由于双语语料稀缺带来的数据稀疏问题严重，利用神经网络方法提升汉蒙机器翻译的效果变得非常困难。本文在汉蒙翻译中应用子字粒度来缓解数据稀疏问题，提高翻译质量。另外，神经网络机器翻译仍然存在随着句子长度的增加，翻译效果明显下降的问题。本文根据句法分析对汉蒙双语进行名词短语的抽取，缩短句子长度，以及利用改进的自注意力机制来缓解抽取操作带来的语义损失问题，提升长句的翻译质量。主要工作如下： 1．汉蒙翻译任务中双语子字切分粒度的研究。在汉蒙神经机器翻译任务中，由于语料缺乏使得数据稀疏问题严重，极大影响了模型的翻译效果。子字粒度切分是通过BPE算法将切分粒度控制在字符和词之间的子字粒度大小，将低频词切分成相对高频的子字片段，来缓解数据稀疏问题，从而在有限的数据和硬件资源条件下，更高效地提升模型的鲁棒性。 2．基于最长名词短语分治策略的翻译模型的实现。目前机器翻译模型对于长句的翻译效果不理想，而汉语和蒙古语属于不同的语言形态类型，句法结构差异较大，简单的根据标点符号将长句切分成短句无法实现。本文通过对汉文进行句法分析，根据句法成分获取汉文的最长名词短语；再根据汉蒙双语的对齐结果，获取蒙古文对应的最长名词短语，形成名词短语句对；最终通过将长句切分成名词短语和主干句，实现句子长度的缩短，最终有效地提升了汉蒙翻译的翻译效果。 3．利用改进的自注意力机制优化模型。自然语言的复杂性使得在抽取最长名词短语时，会产生较大的误差；将完整的句子切分成多个部分，必然会损失部分句子中的语义信息。这两点会直接影响最终的翻译质量。本文利用自注意力机制，在切分片段中融入全局特征，来减小切分误差并补充全局特征，从而提高最终的翻译质量。本文对汉蒙神经网络机器翻译进行研究，通过应用双语子字粒度切分技术，有效的缓解数据稀疏问题，在多种模型上都得到了显著地提升；通过抽取最长名词短语的方法，将平均句子长度从16个字缩短到10个字左右，利用模型翻译短句效果好的优势，提升了模型对于长句的翻译效果；通过修改自注意力机制的计算，缓解名词短语抽取带来的语义损失，修改的Transformer模型较原始模型的BLEU值提升了0.88。

著录项

作者
任众;
展开▼
作者单位

内蒙古大学;

展开▼
授予单位内蒙古大学;
学科计算机科学与技术
授予学位硕士
导师姓名侯宏旭;
年度 2019
页码
总页数
原文格式 PDF
正文语种中文
中图分类自动化基础理论;
关键词
最长名词短语; 处理; 神经网络; 机器;

相似文献

中文文献
外文文献
专利

1. 融合先验信息的蒙汉神经网络机器翻译模型 [J] . 樊文婷 ,侯宏旭 ,王洪彬 . 中文信息学报 . 2018,第006期
2. 基于神经网络迁移学习的蒙汉机器翻译方法 [J] . 赵亚平 ,苏依拉 ,牛向华 . 计算机应用与软件 . 2020,第001期
3. 基于门控循环神经网络词性标注的蒙汉机器翻译研究 [J] . 刘婉婉 ,苏依拉 ,乌尼尔 . 中文信息学报 . 2018,第008期
4. 基于统计和神经网络的蒙汉机器翻译研究 [J] . 任众 ,侯宏旭 ,武静 . 中文信息学报 . 2018,第011期
5. 基于神经网络的汉蒙机器翻译研究 [J] . 胡其吐1 ,白双成1 . 内蒙古社会科学：蒙文版 . 2018,第006期
6. 基于最长名词短语分治策略的神经机器翻译 [C] . 张学强 ,蔡东风 ,叶娜 . 第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会 . 2017
7. 融合AMR的汉蒙神经网络机器翻译模型的研究 [A] . 王雪皎 . 2021

基于最长名词短语处理的汉蒙神经网络机器翻译模型

目录

摘要

著录项

相似文献

相关主题

期刊订阅