首页> 中文学位 >基于NP树的英文专利文献术语自动翻译技术研究
【6h】

基于NP树的英文专利文献术语自动翻译技术研究

代理获取

摘要

随着对外交流,引进先进技术的增加,人们接触专利文献的机会越来越多。从事科技翻译的人员经常要遇到专利文献的翻译问题。而术语翻译尤其是专利文献翻译的一个重要部分。近年来机器翻译技术取得了很大的突破,使得翻译质量有了很大的提高,为专利文献翻译提供了有力的手段。
  本文针对专利文献中的术语NP(noun phrase)的特点,使用统计和规则相结合的方法实现了术语NP的自动翻译。从建立NP树库,译文选择模型的建立,NP翻译模式的归纳,到基于知网的最相似NP树的查找以及翻译结果的自动评测,实现了一个完整的术语翻译流程。
  主要工作包括以下几个方面:
  第一,提出了一种改进互信息的译文选择方法。本文认为词语的译文的选择不是孤立进行的,上下文对译文的选择有着重要的意义,通过对已有的互信息公式加入翻译模型特征进行改进,结合翻译模型与互信息来选择最佳译文。
  第二,采用了NP翻译模式进行译文的调序处理。根据术语NP的特点,对句法分析后的NP进行翻译模式的总结,概括出比较常用的NP翻译模式,作为复杂NP进行译文调序的依据。
  第三,提出了一种基于HowNet的最相似NP树的查找方法。本文将已有的基于HowNet的词语相似度公式进行扩展,提出基于HowNet的NP语义相似度计算方法来进行最相似NP树的查找。
  第四,建立一个完整的术语翻译系统。使用机器翻译自动评测技术进行翻译结果的自动评测,与基于短语的统计机器翻译系统(Pharaoh)进行对比实验。
  实验结果表明本文基于NP树的术语翻译方法优于基于统计的机器翻译方法(Pharaoh)。对于下一步的工作,尝试加入更多NP翻译模式和语言学知识来改善翻译效果。

著录项

  • 作者

    林晓庆;

  • 作者单位

    沈阳航空航天大学;

    沈阳航空工业学院;

  • 授予单位 沈阳航空航天大学;沈阳航空工业学院;
  • 学科 计算机应用技术
  • 授予学位 硕士
  • 导师姓名 张桂平,蔡东风;
  • 年度 2009
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 翻译机;
  • 关键词

    专利文献; 术语机器翻译; NP翻译模式; 语言学知识;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号