首页> 中文学位 >大规模中文机构名称与机构地址自动翻译研究
【6h】

大规模中文机构名称与机构地址自动翻译研究

代理获取

目录

大规模中文机构名称与机构地址自动翻译研究

RESEARCH ONAUTO TRANSLATION OFLARGE-SCALE CHINESE ORGANIZATIONNAME AND ADDRESS

摘 要

Abstract

第1章 绪论

1.1 课题来源

1.2 课题背景和意义

1.3 国内外研究现状和不足

1.4 本文的研究内容和章节安排

第2章 机构名称的翻译方法研究

2.1 引言

2.2 中文机构名称构成规则

2.3 机构名称的切分模式

2.4 机构名称翻译系统的设计与实现

2.5 本章小结

第3章 机构地址的翻译方法研究

3.1 中文机构地址的构成规则

3.2 中文机构地址的切分模式

3.3 机构地址的高精度切分

3.4 机构地址的翻译方法研究

3.5 机构地址翻译系统的设计和实现

3.6 本章小结

第4章 知识库的创建与维护

4.1 知识库的创建

4.2 知识库的维护

4.3 本章小结

第5章 实验与性能评测

5.1 评测方法简介

5.2 机构名称翻译评测介绍

5.3 机构地址翻译评测介绍

5.4 本章小结

结 论

参考文献

哈尔滨工业大学硕士学位论文原创性声明

哈尔滨工业大学硕士学位论文使用授权书

致 谢

展开▼

摘要

随着经济的发展,为了让更多的国外企业了解到国内的生产厂家信息,及时进行业务联系,经济信息之间的交流尤其是作为“企业身份证”的组织机构代码信息的交流变得非常重要,充分利用现有自然语言研究的成功,突破组织机构代码国际交流的瓶颈,已经是一件可行的事情。
  本文的研究内容主要是机构名称和机构地址这类命名实体的翻译技术。虽然近年来命名实体翻译的研究有所增多,但无论是通用的机器翻译技术、单纯的音译技术还是NE对齐的技术,它们各自都存在着自身难以克服的局限性。
  本文的研究对象具有特殊性,它并非长文本中的机构名称和机构地址,而是全国组织机构代码管理中心接受的注册过的机构名称和机构地址,因此它具有每条记录相对简短、满足一定的规律性、总体数据量大、包罗了各行各业的机构名称和复杂程度不同的机构地址、未登录词多等特点。结合以上特点,本文给出了一种基于模板匹配的机构名称识别和翻译的方法和一种基于模板匹配和基于规则相结合的中文机构地址的翻译方法。本文的主要以下几个方面:
  1.通过对机构名称的结构分析发现了它的构成规则,并采用基于AP的正向最大匹配切分和基于PPOP的逆向最大匹配切分两种并行分词方法对机构名称进行分词,然后对两种切分结果进行基于词性码的合并,并按照一定的规则对歧义字段进行消歧,最后对每个节点进行翻译得到最后的翻译结果。
  2.通过对机构地址构成的总结,将机构地址细分为四种类型的地址单元构成,并在切分的时候采用优先切分模式将法定地名和长地名切分出去,然后再对剩下的字段进行基于地址单元的切分,将切分后的地址进行相应地址单元的翻译并组合即得到机构地址的翻译。
  3.在上述方法的指导下,本文给出了机构名称和机构地址的汉英翻译系统的设计和实现方法。
  4.通过分析知识库使用流程,研究出了能够避免冲突且可以选出最优规则的知识库维护规则。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号