首页> 中文学位 >汉-维时间数字和量词的识别与翻译研究
【6h】

汉-维时间数字和量词的识别与翻译研究

代理获取

目录

第一章 绪论

1.1研究背景与研究意义

1.2命名实体识别与翻译的国内外研究现状

1.3 论文结构

第二章 理论及技术基础

2.1传统机器翻译的方法

2.2神经机器翻译及基本知识介绍

2.3 Seq2Seq的应用领域

2.3本章总结

第三章 汉语-维吾尔语时间表达式的识别与翻译研究

3.1 引言

3.2汉语-维吾尔语时间日期类对比

3.3汉语-维吾尔语时间识别与翻译方法

3.4时间表达式实验与分析

3.5本章总结

第四章 汉语-维吾尔语数字的识别与翻译研究

4.1汉语-维吾尔语的数字对比

4.2汉语-维吾尔语数字的识别与翻译方法

4.3数字识别与翻译实验

4.4本章总结

第五章 汉语-维吾尔语量词的识别与翻译研究

5.1汉维量词翻译的对比

5.2汉维无歧义量词

5.3量词实验结果

5.4本章总结

第六章 基于Seq2Seq的汉维有歧义量词翻译方法

6.1 RNN(Recurrent Neural Network)模型

6.2基于RNN的Neural Machine Translation

6.3 量词在机器翻译中的翻译实验结果

6.4有歧义量词在神经网络中遇到的难题

6.5基于神经机器翻译的实验与分析

6.6本章总结

第七章 总结与展望

7.1总结

7.2展望

参考文献

攻读学位期间发表的学术论文

致谢

声明

展开▼

摘要

随着机器翻译技术的迅速发展,命名实体识别与翻译研究取得了突破性的进展,它是在自然语言处理中的关键性研究分支。如今,汉语-维吾尔语机器翻译领域中开展了大量的研究工作。本文提出了基于规则与模板的时间、数字、无歧义量词、有歧义量词的翻译方法及基于神经网络的有歧义量词翻译方法。本文主要研究以下三个方面的工作:
  (1)根据汉语-维吾尔语的翻译需求和维吾尔语的语法结构,首先收集与挖掘大量的汉语时间表达式、数字的分类(基数、约数、集合数、分数、倍数),然后分别构建双语规则库和翻译模板,识别汉语时间表达式或数字并找出它相应的规则模板,输出时间表达式或数字对应的维吾尔语翻译结果。
  (2)对于量词进行分析与归类,将量词分为有歧义量词与无歧义量词,无歧义量词分为四种情况(数字一一对应,量词丢失;数字一一对应,量词一一对应;数字丢失,量词一一对应;数字量词均丢失;),对有歧义量词根据上下文名词的不同,量词对应的翻译结果也有所不同,通过上述的分类方法收集量词短语并分别增加规则库。
  (3)基于Seq2Seq模型实现有歧义量词短语的神经机器翻译并有效提高了汉语-维吾尔语量词的翻译准确率。
  为了提高汉维机器翻译系统对时间、数字和量词短语的翻译性能,本文利用双语语料库提取汉语时间、数字和量词短语,实现了基于规则与模板、神经网络的的翻译方法。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号