声明
摘要
第一章 绪论
1.1 研究背景和意义
1.2 机器翻译概述
1.3 旅游领域机器翻译存在的问题
1.4 本文研究内容
1.5 组织结构
第二章 统计机器翻译的相关研究
2.1 基于词的模型
2.2 基于短语的模型
2.3 基于句法的模型
2.4 近年研究热点
第三章 汉语旅游文本中非信息句识别研究
3.1 问题概述
3.2 总体思路
3.3 基于规则的非信息句识别方法
3.4 基于机器学习的非信息句识别方法
3.4.1 分类特征及特征选择
3.4.2 分类器
3.5 引入集成学习的半监督非信息句识别方法
3.5.1 基于Self-Training的半监督方法
3.5.2 引入集成学习的半监督方法
3.6 实验及讨论
3.6.1 实验设置
3.6.2 特征维度和正负类比例影响实验
3.6.3 引入集成学习的半监督方法效果实验
3.6.4 基于规则和基于统计方法串行的效果实验
3.7 本章小结
第四章 基于复述技术的汉语成语翻译方法研究
4.1 问题概述
4.2 总体思路
4.3 成语复述的获取
4.3.1 基于单语平行语料库的成语复述抽取方法
4.3.2 基于双语平行语料库的成语复述抽取方法
4.3.3 基于词典的成语复述抽取方法
4.3.4 三种方法的比较和分析
4.4 成语复述的替换选择
4.5 汉英SMT中成语复述替换方法
4.5.1 方法1:测试集成语复述瞢换
4.5.2 方法2:训练集成语复述替换
4.6 实验与讨论
4.6.1 实验设置
4.6.2 方法1性能测试实验
4.6.3 方法2性能测试实验
4.7 本章小结
第五章 汉英旅游统计机器翻译系统Backpacker构建
5.1 系统概要
5.2 系统实现
5.2.1 数据资源
5.2.1 数据处理
5.3 系统翻译实例分析
第六章 总结与展望
6.1 研究工作总结及其创新点
6.2 未来工作展望
参考文献
致谢
硕士期间科研成果