首页> 中文学位 >《蒙汉双语对齐语料库》的实验性研究与实现
【6h】

《蒙汉双语对齐语料库》的实验性研究与实现

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1课题背景和应用价值

1.2语料库的研究历史和现状

1.2.1现代语料库的简短历史

1.2.2蒙古文语料库研究现状

1.2.3双语对齐语料库研究现状

1.3需要解决的关键问题

1.4论文组织

第二章蒙汉双语语料库实验系统的总体设计

2.1总体功能模块设计

2.2双语语料库开发环境和运行环境

2.2.1开发环境

2.2.2运行环境

2.3数据库建立

2.4双语对齐语料库的构建流程

2.5语料的建立

2.5.1关于语料库

2.5.2关于语料的建立

第三章基于语料库的对齐信息检索工具的设计与实现

3.1语料库对齐信息检索工具的设计

3.2语料库对齐信息检索工具的实现

3.2.1句子对齐信息检索工具的实现

3.2.2词汇对齐信息检索工具的实现

3.2.3结构对齐信息检索工具的实现

第四章系统维护功能的设计与实现

4.1维护功能的设计与实现

4.1.1维护功能的设计

4.1.2维护功能的实现

4.2蒙古文输入法安装

4.3数据库链接的设置

第五章基于双语语料库实验系统的实例分析

5.1蒙汉双语语料库实验系统的主界面

5.2双语语料库实例分析

第六章总结和展望

6.1总结

6.2论文的局限性

6.3进一步的工作和展望

参考文献

附录

攻读硕士学位期间发表的学术论文

致谢

展开▼

摘要

在自然语言处理领域,双语对齐语料库的重要性日益加强,它在机器翻译、词典编纂、信息检索、翻译知识的获取、词义排歧等领域有着重要的研究和应用价值。双语语料库的研究工作主要集中在语料的构建、对齐和标注等方面。 在过去的三十年里,各国的研究人员相继建立了许多印欧语言的平行语料库。与之相比,汉英双语对齐语料库的研究国内外都相对较少,尤其是蒙语语料库与其它语种语料库的对齐研究就更少。本文的工作主要集中在蒙汉双语对齐语料库词性标注、词汇对齐及句法分析的研究上,主要包括以下部分: 1.词性标注。蒙古文的附加成分比较多,比如()(做)有()(主动态),()(被动态),()(使动态),()(互动态),()(同动态)等多种形态变化。本语料进行标注时不仅确定了词性标记集,而且还确定了体现这些形态变化的标记集。 2.词汇对齐。词汇对齐是发现与源语言词汇具有最高语义相似度的目标语。蒙文词汇和汉文词汇有许多特殊对应关系,如:有些汉语动词短语对应蒙语动词;有些蒙语动词短语对应汉语动词;蒙语的数词很多情况下对应汉语的数量词;还有空对齐等情况。本文中较详细地分析了蒙文句子和汉文句子语义对应关系,进行了特征标记,并实现了双语句子、词汇、句法结构等不同类型的对齐信息的检索工具。 3.句法分析。句法分析是对句子和短语的结构进行分析。在语言自动处理的研究中,句法分析的研究是最为集中的。本文使用了自项向下的句法分析方法分析了双语实验语料,并利用广义表方法生成了蒙古文和汉文句子各自的句法树。 本文最终建立了一个蒙汉双语语料库实验系统,该系统的语料中包含了词汇对齐、词性、句子成分和句法结构等标注信息,并具有对齐信息检索功能和语料库维护功能。通过对典型语料实验实例的分析,表明该系统对机器翻译以及翻译知识的自动获取研究具有重要意义。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号