首页> 中文学位 >统计机器翻译中源语言语句调序方法的研究
【6h】

统计机器翻译中源语言语句调序方法的研究

代理获取

目录

声明

致谢

摘要

1 引言

1.1 研究背景和意义

1.2 国内外研究现状

1.3 论文研究内容

1.4 论文组织结构

2 基于短语结构的调序方法

2.1 现有调序规则集介绍

2.2 对现有调序规则集的扩展

2.3 基于短语结构的调序方法的实现

3 基于依存结构的调序方法

3.1 基于依存结构的调序框架

3.2 中-英统计机器翻译中的应用

3.3 中-日统计机器翻译中的应用

3.4 日-中统计机器翻译中的应用

3.5 基于依存结构的调序方法的实现

3.5.1 中-英、中-日方向上的实现

3.5.2 日-中方向上的实现

4 评测实验及结果分析

4.1 实验设置

4.1.1 数据集

4.1.2 实验工具

4.1.3 评测标准

4.2 基于短语结构的调序实验

4.3 基于依存结构的调序实验

4.3.1 中-英方向上的实验结果与分析

4.3.2 中-日方向上的实验结果与分析

4.3.3 日-中方向上的实验结果与分析

5 句法分析器比较实验

5.1 相关研究

5.2 比较实验中的句法分析器及评测指标

5.3 比较实验结果

6 结论与展望

参考文献

作者简历

学位论文数据集

展开▼

摘要

机器翻译是指借助计算机将一种自然语言转变为另一种自然语言,该研究是自然语言处理领域的一个重要分支。统计机器翻译作为机器翻译的主流方法,具有坚实的理论基础和成熟的翻译模型,能够快速有效地构建机器翻译系统。但是,当统计机器翻译方法应用于语序差异性较大的语言对时,现有理论和模型难以有效地抽取和描述语言对之间在语序上的差异性,翻译系统性能由此受到严重影响。
  本论文的工作围绕源语言和目标语言语序存在差异性这一问题,针对统计机器翻译方法的应用,提出了基于句法结构的调序方法。该方法的主要思想是以句法信息为依据,对训练数据和待翻译的源语言句子进行预处理,使其语序更加接近目标语言的语序,以此缓解语序差异性对应用统计机器翻译方法的不良影响。本论文的主要工作包括以下三个方面:
  (1)本工作对已有的基于短语结构句法分析的调序方法,进行了实验重现和深入分析,提出了进一步的改良方法,并以中-英翻译为例,扩展了现有的基于短语结构的调序规则集。
  (2)本论文提出了基于依存结构句法分析的调序方法,其核心是设计了全新的、系统化的调序框架。基于该框架,本工作以中-英、中-日、日-中三个翻译任务为例,针对各语言对的特点,构建了三个调序规则集,实现了基于依存结构的调序方法。这三个规则集分别是针对中-英、中-日和日-中统计机器翻译的首个基于依存结构的调序规则集。
  (3)在基于句法结构的调序方法中,句法分析器的精度至关重要。本工作对公开的句法分析器首次进行了全面的比较实验,以量化的方式评价分析了句法分析器精度与调序方法性能的关系,以及对统计机器翻译系统性能的影响。该研究填补了这一领域的空白,同时为调序方法的应用给出了句法分析器的最佳选择。
  本工作以实际中-英、中-日和日-中统计机器翻译系统开发为例,对本论文所提出的各种调序方法进行了验证。在大规模数据集上的对比实验结果证明了各方法的有效性。同时通过Kendall'sτ的评测和人工评测,验证了各方法的有效性和准确性。此外,在对调序结果进行人工评测时,本文提出了一种全新的基于单词对齐交叉数的调序评测方法。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号