首页> 中文学位 >高精度中文机构名称与地址机译策略研究
【6h】

高精度中文机构名称与地址机译策略研究

代理获取

目录

高精度中文机构名称与地址机译策略研究

RESEARCH ON HIGH-PRECISION MACHINE TRANSLATION OF CHINESE ORGANIZATION NAME AND ADDRESS

摘 要

Abstract

第1章 绪论

1.1 本文研究的背景和意义

1.2 命名实体翻译研究的现状和分析

1.3 本文的主要研究内容和组织

第2章 中文机构名称的翻译

2.1 引言

2.2 机构名称的表示模式

2.3 基于表示模式的高精度切分方法

2.4 机构名称中的歧义现象及消歧策略

2.5 机构名称的翻译

2.6 本章小结

第3章 面向机器翻译的中文机构地址的切分方法

3.1 引言

3.2 中文机构地址的表示模式

3.3 机构地址切分专用知识库

3.4 面向机器翻译的中文机构地址切分

3.5 机构地址的消歧策略

3.6 对比实验

3.7 本章小结

第4章 中文机构地址的翻译

4.1 引言

4.2 中文机构地址翻译规则

4.3 CTR的获取方法

4.4 基于地址单元的翻译方法研究

4.5 本章小结

第5章 中文机构名称及地址汉英翻译系统设计实现

5.1 引言

5.2 中文机构名称和地址翻译系统设计

5.3 实验结果及分析

5.4 本章小结

结论

参考文献

攻读学位期间发表的学术论文

哈尔滨工业大学硕士学位论文原创性声明

哈尔滨工业大学硕士学位论文使用授权书

致谢

展开▼

摘要

机器翻译简单地说就是用计算机将一种自然语言翻译为另一种自然语言。作为信息的主要承载者,命名实体的翻译质量对译文的整体翻译质量具有十分重要的影响,命名实体的翻译也成为研究者关注的焦点。
  在人名、地名的翻译任务利用音译技术基本完成之后,机构名称、地址等非音译信息的翻译成为命名实体翻译探索的重点。由于现有的机构名称及地址的汉英双语语料极其匮乏,导致当前主流的基于统计的机器翻译技术无法发挥优势。针对上述情况,本文构建了以基于表示模式的高精度切分方法为核心的机构名称翻译系统,以及面向机器翻译的中文机构地址切分方法和基于地址单元的翻译机制相结合的中文机构地址翻译系统。具体地讲,本文从如下几个方面进行了研究:
  1.通过分析大量的数据实例,采用上下文无关文法抽象出符合机构名称构成特点的表示模式,并设计了一种基于表示模式的高精度切分方法,通过融合机构独立切分模式和地址独立切分模式得到的两个切分结果,消除机构名称中的歧义。
  2.深入研究了中文地址的构成特点,给出了一个合法的地址单元的定义,构建了符合中文地址构成特点的地址识别知识库,实现了一种面向机器翻译的机构地址切分方法。实验证明,针对机构地址翻译这一特定任务,该方法十分有效。
  3.中文机构地址被切分为地址单元序列之后,需要相应的翻译机制相支撑,才能完成机构地址汉英翻译任务。因此,本文定制了一种基于地址单元的翻译方法,实现了对不同类型的地址单元的翻译。通过CTR的自动获取,解决了广泛存在于基于规则的翻译系统中的规则冲突问题。
  4.本文设计并实现了中文机构名称翻译系统和中文机构地址翻译系统。实验表明,在仅有几千条标准汉英双语语料的情况下,根据5分制评分标准,两个系统的翻译准确率分别为97.28%和91.26%,达到了实用化的翻译水平。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号