首页> 中文学位 >融合日语格语法的层次短语统计机器翻译研究
【6h】

融合日语格语法的层次短语统计机器翻译研究

代理获取

目录

声明

致谢

摘要

1 引言

1.1 研究背景及意义

1.2 研究发展与现状

1.3 本文组织

2 统计机器翻译方法与格语法

2.1 系统模型

2.1.1 噪声信道模型

2.1.2 对数线性模型

2.2 翻译模型

2.2.1 基于词的翻译模型

2.2.2 基于短语和层次短语翻译模型

2.2.3 基于句法的翻译模型

2.3 评价方法

2.3.1 BLEU值

2.3.2 NIST值

2.3.3 METEOR

2.4 格语法

2.4.1 日语浅层格框架

2.4.2 日语格框架获取方法

2.5 问题与思路

3 格框架约束以及格框架规则

3.1 格框架约束研究

3.1.1 传统层次短语规则抽取方法

3.1.2 格框架约束层次短语规则的定义

3.1.3 格框架约束层次短语规则的抽取方法

3.1.4 对比实例分析

3.2 基于chunk的格框架依存树

3.3 格框架规则研究

3.3.1 格框架调序规则定义

3.3.2 格框架调序规则的抽取方法

3.3.3 格框架调序规则的优越性分析

3.4 本章总结

4 解码方法及系统实现

4.1 翻译过程

4.1.1 特征选取

4.1.2 参数训练

4.1.3 柱状搜索

4.2 系统实现

4.3 系统实验与分析

4.3.1 实验数据

4.3.2 基线系统(baseline)

4.3.3 实验结果

4.3.4 实验分析

4.4 分析总结

5 总结与展望

5.1 总结

5.2 展望

5.2.1 机器翻译

5.2.2 格语法

参考文献

作者简历及攻读硕士学位期间取得的研究成果

学位论文数据集

展开▼

摘要

机器翻译是利用计算机实现不同语言间翻译的一门科研型和应用型的学科。随着科技的发展,现在社会信息量膨胀。机器翻译在旅游会话、产品全球化和信息检索等领域的需求量越来越多。近几年,机器翻译研究取得了很大的进展。但是,在具体应用中,机器翻译还未达到令人满意的水平。在统计机器翻译中,如何有效利用语言学知识仍然是机器翻译中的一个研究热点。
  在市场应用中,统计机器翻译方法仍然占据主导地位。所使用的模型主要有短语模型和层次短语模型。由于涉及到句法结构的翻译模型比较复杂,因此其往往很难投入到产品中。然而,随着计算能力的提高,融合语言学和句法知识的翻译模型潜力巨大。因此,如何使用句法知识和语言学知识提高传统模型成为了主要问题。
  格语法是语言学中成熟的语法理论。在众多语言中,日语格是一种显性格,格信息由不同的格助词标记。因此,日语的格框架较其他语言更加明显且容易分析。此外,日语格框架已被使用于日语句法分析,较其他任何语言,日语句法分析得到了最好的效果。因此,本文提出将日语格框架应用于层次短语模型中。这是在统计机器翻译中的首次尝试。本文的贡献可分为以下几点:
  (1)利用日语格框架约束层次短语翻译规则,从语义学的角度阐述层次短语规则的生成,使其更加合理。目的在于更加有效地利用统计学与语言学之间的关系。实验表明层次短语规则数量减少。
  (2)提取日语格框架调序规则,并将其用于翻译过程。目的在于缓解层次短语在长距离调序中,glue规则的频繁使用。并且,本文考虑词对齐的错误带来的影响,在规则抽取过程做了软约束。实验表明提高了翻译质量。
  (3)提出基于chunk的依存树到串的上层翻译过程,使翻译过程更加符合规则的描述。目的在于缓解虚词和助词在词对齐上的影响。
  通过实验分析,本文证明了提出方法的合理性及有效性。

著录项

  • 作者

    刘江鸣;

  • 作者单位

    北京交通大学;

  • 授予单位 北京交通大学;
  • 学科 计算机科学与技术
  • 授予学位 硕士
  • 导师姓名 徐金安;
  • 年度 2015
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 机器翻译;
  • 关键词

    机器翻译; 层次短语; 日语格语法;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号