首页> 中文学位 >基于词素短语的维汉机器翻译技术研究与实现
【6h】

基于词素短语的维汉机器翻译技术研究与实现

代理获取

摘要

随着我国西部大开发的进行及新疆地区的大发展的实施,维汉机器翻译作为一种快捷方便的沟通工具能够辅助新疆地区经济和社会的和谐发展。然而,目前关于维汉机器翻译的研究较少,本文针对基于短语的维汉机器翻译中的数据稀疏等问题,展开了关于维汉机器翻译的研究:
   (1)为了能完整的描述维汉机器翻译方面的问题,本文给出了一个维汉机器翻译研究框架,并对其机理进行了详细叙述。同时,对框架中所涉及的一些关键问题进行了阐述。
   (2)为了缓解维汉机器翻译中的数据稀疏问题,本文在基于短语的维汉机器翻译研究基础上,结合了维语的形态特征,在维汉机器翻译研究框架之下,提出了基于词素短语的维汉机器翻译。该方法将维语单词分割为词干和附加成分两部分词素,使翻译的基本单位由单词短语变为词素短语。相关实验表明,本文给出的方法能够在很大程度上降低维汉机器翻译中的数据稀疏程度,使翻译质量大大提高。
   (3)词切分是基于词素短语的维汉机器翻译的必须步骤,其切分质量将直接影响翻译质量。本文通过研究已有的基于统计的维语词切分方法,结合维语单词的构成规则,给出了一种基于规则的维语词切分方法。基于统计的切分方法是将语言视为由词素和语法组成的模型,通过得到最高的模型概率从而得到该语料库的最佳切分结果。基于规则的切分方法是按照维语的附加成分库及音节规则,语音变化等规则,并结合从语料库中得到的词干库从而得到最终的切分结果。实验表明,基于规则的切分方法由于符合维语的实际情况,因此所得结果比基于统计的切分方法较好。
   (4)对本文所述的方法进行了实现,并开发出了TellMeaning维汉机器翻译系统。本文给出了一个较为完整的维汉机器翻译框架,同时结合维语特征,对维语单词进行了词切分,并引入词素概念缓解了翻译中的数据稀疏问题。本文所给的方法具有良好的实用性,并对相关机器翻译系统开发具有一定的借鉴意义。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号