首页> 中文学位 >基于短语的统计机器翻译系统的研究与应用
【6h】

基于短语的统计机器翻译系统的研究与应用

代理获取

目录

文摘

英文文摘

原创性声明及版权授权说明

第1章引言

1.1课题的提出

1.2课题的意义

1.3研究目标

1.4论文的组织

第2章统计机器翻译相关理论

2.1框架模型

2.1.1噪声通道模型

2.1.2对数线性模型

2.2特征模型

2.2.1语言模型

2.2.2翻译模型

2.3本章小结

第3章系统工作的基本原理

3.1系统框架

3.2基于短语的翻译

3.3搜索过程

3.3.1合并假设

3.3.2堆栈搜索

3.3.3未来代价估计

3.3.4 N-best列表生成

3.4本章小结

第4章系统的实现

4.1系统运行环境

4.2可用资源和工具介绍

4.2.1语言模型工具SRILM

4.2.2词语对齐工具GIZA++

4.2.3解码器工具PHARAOH

4.2.4机器翻译自动评测工具mteval-v09.pl

4.3模型训练及参数设置

4.3.1语言模型训练

4.3.2词对齐模型训练及参数设置

4.3.3短语对齐模型训练及参数设置

4.4解码器参数设置

4.5本章小结

第5章机器翻译的自动评测

5.1 BLEU评测方法

5.2 NIST评测方法

第6章系统的应用

6.1航空领域标题的特点

6.2标题语料的预处理

6.3模型参数的训练

6.4标题的翻译

6.5翻译结果的自动评测

6.6本章小结

结 论

参考文献

致 谢

攻读硕士期间发表(含录用)的学术论文

展开▼

摘要

机器翻译是自然语言处理领域中的一个热点和难题,机器翻译的研究对国际间交流合作、学术上和商业上都具有十分重要的理论和实践意义。本文在调研了国内外机器翻译研究历史与现状的基础之上,分析了目前统计机器翻译的相关理论,实现了一个统计机器翻译系统,并将其应用于航空领域标题的翻译,取得较好的翻译效果。 本文的创新点在于整合了国际上一些公开的工具,改进了翻译模型模块,搭建了一个基于短语的统计机器翻译系统。从语料的预处理,模型参数的训练,翻译过程的执行,到最后翻译结果的自动评测,实现了一个完整的翻译流程。 主要的工作包括以下几个方面: 第一,语料的预处理。语料的加工程度直接影响翻译结果。统计机器翻译通常都采用双语语料,本文分别对中英文两种语言的语料进行了预处理。 第二,在对统计机器翻译的相关理论进行了研究的基础之上,利用一些现有的资源和工具,补充了短语翻译模型模块,实现了一个基于短语的统计机器翻译系统。并介绍了系统工作的基本原理,系统实现,系统运行环境和参数设置。 第三,将系统应用于航空领域标题的翻译。结合航空领域标题的特点,进行有针对性的翻译,取得了较好的翻译效果。 第四,机器翻译自动评测技术的研究。本文在研究自动评测技术的基础上,将航空领域标题翻译的结果进行了自动评测。 本文的研究和实验证实了基于短语的统计机器翻译方法的有效性。目前,也有人在探索基于语言深层结构的翻译模型,这已成为一个新的研究点,相信在这方面,统计机器翻译还有较大的改进空间,这也是下一步研究的重点。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号