声明
摘要
第1章 绪论
1.1 研究背景
1.2 研究动机
1.2.1 传统翻译模型的局限性
1.2.2 判别式模型的优势
1.3 论文组织结构
第2章 相关技术概述
2.1 统计机器翻译基本流程
2.1.1 模块概述
2.1.2 预处理
2.1.3 词对齐
2.1.4 翻译规则学习
2.1.5 权重调优
2.1.6 解码
2.1.7 评价
2.2 判别式学习
2.3 依存句法分析
2.4 翻译模型概述
2.4.1 基于词的翻译模型
2.4.2 基于短语的统计机器翻译模型
2.4.3 基于层次短语的统计机器翻译模型
2.4.4 串到树的统计机器翻译模型
2.4.5 树到串的统计机器翻译模型
2.4.6 树到树的统计机器翻译模型
2.5 语言模型
2.5.1 语言模型概述
2.5.2 数据稀疏问题的解决
第3章 基准系统
3.1 基准系统概述
3.2 数据集
3.2.1 IWSLT
3.2.2 GEO
3.3 基于短语结构的基准系统
3.3.1 短语结构基准系统的参数细节
3.3.2 短语结构基准系统性能
3.4 基于句法结构的基准系统
3.4.1 句法结构基准系统的参数细节
3.4.2 句法结构基准系统的性能
3.5 评价方法
3.5.1 BLEU
3.5.2 METEOR
3.6 本章小结
第4章 基于判别式模型和词排序技术的树到树机器翻译系统
4.1 感知机模型
4.1.1 模型定义
4.1.2 模型介绍
4.1.3 应用任务
4.1.4 参数学习
4.2 词排序
4.2.1 概述
4.2.2 应用
4.2.3 词排序举例
4.2.4 模型
4.3 依存句法分析
4.3.1 依存句法树简介
4.3.2 依存句法分析算法
4.4 系统实现
4.4.1 系统框架和流程
4.4.2 双语数据预处理
4.4.3 词对齐
4.4.4 双语句法分析
4.4.5 短语表抽取和翻译概率统计
4.4.6 翻译选项过滤
4.4.7 模型训练
4.4.8 模型解码
4.4.9 后处理
4.4.10 评价
4.5 翻译模型及特征模板
4.5.1 单语特征
4.5.2 语言模型
4.5.3 双语特征
4.6 本章小结
第5章 实验
5.1 IWSLT
5.1.1 开发集性能
5.1.2 测试集性能
5.1.3 翻译举例
5.2 GEO
5.2.1 开发集性能
5.2.2 测试集性能
5.2.3 翻译举例
5.3 本章小结
第6章 工作总结与展望
6.1 创新
6.2 挑战
6.3 未来
参考文献
致谢
硕士期间参加的科研项目