首页> 中文学位 >超输入抓录技术对汉英机器翻译解码的优化
【6h】

超输入抓录技术对汉英机器翻译解码的优化

代理获取

目录

摘要

第1章 绪论

1.1 本研究的背景、目的及意义

1.2 相关研究综述

1.2.1 输入法领域的研究综述

1.2.1 中文分词领域的研究综述

1.2.2 机器翻译领域的研究综述

1.3 本研究的主要工作

1.4 本文的组织结构

第2章 超输入信息处理

2.1 超输入信息的编码方案

2.2 超输入抓录技术

2.2.1 整句输入法原理

2.2.2 超输入抓录技术的实现

2.3 超输入化文本示例

2.4 超输入化文本的编辑器

2.5 本章小结

第3章 基于超输入信息的中文分词

3.1 平凡句的超输入信息与分词

3.2 非平凡句的超输入化文本的采集

3.2.1 录入集的构建

3.2.2 采集结果与分析

3.3 超输入信息的后处理

3.3.1 一次性输入的分类

3.3.2 提取阶段

3.3.3 切分阶段

3.3.4 纠错阶段

3.4 评测结果与分析

3.5 本章小结

第4章 融入超输入信息的汉英机器翻译

4.1 基于短语的翻译模型的解码

4.2 翻译错误与分析

4.3 融入超输入信息的解码过程

4.3.1 超输入化文本的短语化

4.3.2 解码过程的改进

4.4 评测结果与分析

4.5 本章小结

结论

参考文献

致谢

声明

展开▼

摘要

用户在使用输入法时,除了会产生文字信息之外,还会通过功能键产生交互性信息,本研究称其为超输入信息,并发掘了它在中文信息处理领域的价值。
  本研究首先揭示了超输入信息为中文分词和机器翻译带来的启发性作用。随后为记录、获取和编辑超输入信息,分别设计和开发了超输入信息的编码方案、超输入抓录技术和超输入化文本的编辑器。接下来研究了基于超输入信息的分词方法,分别采用众包和基于记忆的方法处理未登录词和歧义结构,并将其余超输入信息直接转化为分词结果。与ICTCLAS相比,该方法在测试集上的F值的增幅在3.9%以上。最后研究了将超输入信息融入机器翻译解码过程的方法。在柱搜索的扩展翻译假设步骤增加了约束,使其能根据超输入信息更好地选词和调序。经实验,融入超输入信息后,测试集的BLEU值比普通解码提高了0.23。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号