首页> 中文学位 >日语被动态与可能态的统计机器翻译研究
【6h】

日语被动态与可能态的统计机器翻译研究

代理获取

目录

声明

致谢

摘要

1.1 研究背景及意义

1.2 研究发展与现状

1.3 本文组织

2 统计机器翻译方法

2.1 统计机器翻译系统模型

2.1.1 噪声信道模型

2.1.2 对数线性模型

2.1.3 语言模型

2.1.4 解码算法

2.2 现有统计机器翻译模型简介

2.2.1 基于词的翻译模型

2.2.2 基于短语的翻译模型

2.2.3 基于层次短语的翻译模型

2.2.4 基于句法树的翻译模型

2.4 机器翻译评价方法

2.4.1 人工评测方法

2.4.2 BLEU评测方法

2.4.3 NIST评测指标

2.5 本章小结

3 日语被动态与可能态分类模型

3.1 日语被动态与可能态

3.1.1 日语谓词的语态变化

3.1.2 被动态与可能态的标注

3.2 日语依存句法树

3.2.1 依存树简介

3.2.2 依存树解析

3.2.3 语态特征抽取

3.3 语态分类模型

3.3.1 最大熵模型

3.3.2 基于最大熵的语态分类模型

3.3.3 支持向量机模型

3.3.4 基于SVM的语态分类模型

3.4 本章小结

4 融合语态特征的翻译模型

4.1 翻译系统结构

4.2 最大熵规则分类

4.2.1 规则歧义

4.2.2 最大熵规则分类模型

4.3 规则特征抽取

4.3.1 日汉层次短语规则抽取

4.3.2 日英层次短语规则抽取

4.3.3 规则特征抽取算法

4.4 特征融合与解码

4.4.1 特征融合

4.4.2 解码流程

4.5 本章小结

5 融合语态特征翻译实验

5.1 语态分类实验及结果分析

5.2 日汉翻译实验及结果分析

5.2.1 实验系统设置

5.2.2 实验结果及分析

5.3 日英翻译实验及结果分析

5.3.1 实验系统设置

5.3.2 实验结果及分析

5.4 本章小结

6.1 总结

6.2 展望

参考文献

作者简历及攻读硕士/博士学位期间取得的研究成果

学位论文数据集

展开▼

摘要

近年来机器翻译研究进展显著,但译文的质量仍存在很大的改善空间。如何在统计机器翻译模型中有效融合深层语义知识,如时态、语态信息等进行翻译,是研究热点之一。
  日语属于黏着语系,通过谓语词尾的变化来表达语态信息。而日语被动态和可能态词尾变化相同,导致统计机器翻译中难以对其正确区分及翻译。层次短语模型采用形式化句法进行建模和解码,易于拓展,但该模型无法有效解决日语被动态和可能态的翻译问题。针对此问题,本文提出了有效的解决方案、系统设计和实验验证。
  本文的创新点和贡献主要有以下三点:
  (1)总结归纳日语语言学知识,从日汉和日英两个角度,对被动态与可能态句子进行分析,通过对日语依存句法树的解析分析其结构特征,确定语态相关的特征来构建语态分类模型,有效区分被动态、可能态和其它语态。
  (2)分析总结层次短语翻译模型中可能态和被动态规则歧义问题,将不同语态的翻译看作是解码器对不同语态的规则选择问题,融合更多的语态上下文信息,提出了一种面向层次短语模型的规则特征抽取算法。
  (3)针对不同语种的被动和可能语态的句法结构差异影响机器翻译质量的问题,本文提出了融合语态特征的最大熵翻译模型。抽取双语特征训练最大熵规则分类模型,将语态特征融合入对数线性模型中以改善翻译模型,提高了解码器在翻译被动语态和可能语态时规则选择的准确性。
  实验结果表明,该方法可以有效地改善日语统计机器翻译的句法结构调序和词汇翻译,提升被动语态和可能语态句子的翻译质量。

著录项

  • 作者

    王楠;

  • 作者单位

    北京交通大学;

  • 授予单位 北京交通大学;
  • 学科 计算机科学与技术
  • 授予学位 硕士
  • 导师姓名 徐金安;
  • 年度 2017
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 H365.9;
  • 关键词

    日语; 被动语态; 可能语态; 统计机器翻译;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号