统计机器翻译中源语言语句调序方法的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

机器翻译是指借助计算机将一种自然语言转变为另一种自然语言，该研究是自然语言处理领域的一个重要分支。统计机器翻译作为机器翻译的主流方法，具有坚实的理论基础和成熟的翻译模型，能够快速有效地构建机器翻译系统。但是，当统计机器翻译方法应用于语序差异性较大的语言对时，现有理论和模型难以有效地抽取和描述语言对之间在语序上的差异性，翻译系统性能由此受到严重影响。
　　本论文的工作围绕源语言和目标语言语序存在差异性这一问题，针对统计机器翻译方法的应用，提出了基于句法结构的调序方法。该方法的主要思想是以句法信息为依据，对训练数据和待翻译的源语言句子进行预处理，使其语序更加接近目标语言的语序，以此缓解语序差异性对应用统计机器翻译方法的不良影响。本论文的主要工作包括以下三个方面:
　　(1)本工作对已有的基于短语结构句法分析的调序方法，进行了实验重现和深入分析，提出了进一步的改良方法，并以中-英翻译为例，扩展了现有的基于短语结构的调序规则集。
　　(2)本论文提出了基于依存结构句法分析的调序方法，其核心是设计了全新的、系统化的调序框架。基于该框架，本工作以中-英、中-日、日-中三个翻译任务为例，针对各语言对的特点，构建了三个调序规则集，实现了基于依存结构的调序方法。这三个规则集分别是针对中-英、中-日和日-中统计机器翻译的首个基于依存结构的调序规则集。
　　(3)在基于句法结构的调序方法中，句法分析器的精度至关重要。本工作对公开的句法分析器首次进行了全面的比较实验，以量化的方式评价分析了句法分析器精度与调序方法性能的关系，以及对统计机器翻译系统性能的影响。该研究填补了这一领域的空白，同时为调序方法的应用给出了句法分析器的最佳选择。
　　本工作以实际中-英、中-日和日-中统计机器翻译系统开发为例，对本论文所提出的各种调序方法进行了验证。在大规模数据集上的对比实验结果证明了各方法的有效性。同时通过Kendall'sτ的评测和人工评测，验证了各方法的有效性和准确性。此外，在对调序结果进行人工评测时，本文提出了一种全新的基于单词对齐交叉数的调序评测方法。

著录项

作者
蔡景晟;
展开▼
作者单位

北京交通大学;

展开▼
授予单位北京交通大学;
学科计算机科学与技术
授予学位硕士
导师姓名张玉洁;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类机器翻译;
关键词
机器翻译; 源语言; 语句调序; 句法结构; 语序差异性;

相似文献

中文文献
外文文献
专利

1. 浅析翻译中源语言与目的语不对等情况的翻译方法——以英语翻译为例 [J] . 李璐1 ,仲雅荧1 . 纳税 . 2017,第030期
2. 有限语料汉蒙统计机器翻译调序方法研究 [J] . 陈雷 ,李淼 ,张健 . 中文信息学报 . 2013,第005期
3. 汉蒙统计机器翻译中的调序方法研究 [J] . 王斯日古楞 ,斯琴图 ,那顺乌日图 . 中文信息学报 . 2011,第004期
4. 句法调序的统计机器翻译方法研究 [J] . 孙广范 ,宋金平 ,肖健 . 计算机工程与应用 . 2009,第036期
5. 第二语言心理语言学研究方法新论--《二语心理语言学研究方法》评述 [J] . 贾冠杰 . 外文研究 . 2016,第002期
6. 汉蒙统计机器翻译中的调序方法研究 [C] . 王斯日古楞 ,斯琴图 ,那顺乌日图 . 第十三届中国少数民族语言文字信息处理学术研讨会 . 2011
7. 融入头-修饰词调序模型的短语统计机器翻译方法研究 [A] . 刘水 . 2011

统计机器翻译中源语言语句调序方法的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅