首页> 中文学位 >基于依存树到串模型的日汉统计机器翻译研究
【6h】

基于依存树到串模型的日汉统计机器翻译研究

代理获取

目录

声明

致谢

摘要

1 引言

1.1 研究背景与意义

1.2 研究现状与发展

1.3 本文研究的主要内容

2 统计机器翻译简述

2.1 数学模型

2.1.1 噪声信道模型

2.1.2 对数线性模型

2.2 机器翻译的主要任务

2.3 现有统计机器翻译模型简介

2.3.1 基于词的翻译模型

2.3.2 基于短语的翻译模型

2.3.3 基于层次短语的翻译模型

2.3.4 基于句法树的翻译模型

2.4 机器翻译评测指标

2.4.1 BLEU评测指标

2.4.2 NIST评测指标

2.5 本章小结

3 基于日语依存树的格框架文法定义及获取

3.1 格语法

3.1.1 格语法

3.1.2 日语格框架

3.2 依存树

3.2.1 依存树简介

3.2.2 日语依存树中的格框架

3.3 日语依存树中的格框架获取

3.3.1 日语格框架文法定义

3.3.2 日语格框架获取

3.4 本章小结

4 日汉依存树到串翻译模型

4.1 日汉依存树到串翻译模型

4.2 日汉依存树到串模型的规则抽取

4.2.1 依存树标记

4.2.2 可抽取格框架调序规则的子树判定

4.2.3 规则抽取

4.2.4 规则的概率估算

4.2.5 统计机器翻译系统下格框架调序规则的修正

4.3 日汉依存树到串翻译模型的解码算法

4.3.1 解码公式的形式化描述

4.3.2 解码算法

4.4 本章小结

5 依存树到串翻译模型翻译实验

5.1 日汉翻译实验及结果分析

5.1.1 实验系统设置

5.2.2 实验结果及分析

5.2 日英翻译实验及结果分析

5.2.1 实验系统设置

5.2.2 实验结果及分析

5.3 本章小结

6 总结与展望

6.1 总结

6.2 展望

参考文献

作者简历及攻读硕士学位期间取得的研究成果

学位论文数据集

展开▼

摘要

机器翻译是自然语言处理研究领域的一个重点和难点问题,具有重要的研究价值和商业应用前景。近年来,统计机器翻译技术发展迅速,如何在统计翻译模型中融合更多的句法结构和语义信息,实现真正意义上基于语义的统计机器翻译,是研究人员共同努力的方向,也是研究的热点。本文以格语法和日语依存树为切入点,以日汉统计机器翻译为主要研究方向,重点研究并提出了一种基于语义的日汉统计机器翻译模型。本文的主要研究成果包括:
  (1)基于格语法和日语依存结构定义了一种日语格框架文法。并且,基于该文法提出了适用于统计机器翻译中依存树到串模型的格框架调序规则,使得格语法信息能有效地融合到依存树到串翻译模型中。
  (2)提出一种新的依存树到串统计机器模型。该模型定义了一种新的格框架调序规则。该调序规则与词汇化短语翻译规则融合应用于该依存树到串模型中,其实用性在基于大规模训练语料的实验下得到了有效验证。
  (3)提出了适用于日汉翻译的依存树到串模型的解码算法。采用了自底向上的图解码算法,并加入了短语优化本文方法。
  本文方法成功地将语言学知识融合到统计机器翻译的依存树到串模型中。日汉方向的实验结果表明,本文提出的方法可有效改善日汉统计机器翻译的句法结构调序和词汇翻译,并提升统计机器翻译译文质量。日英方向的实验结果表明,本文方法在以日语为源端的其他语言同样有效。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号