首页> 中文学位 >多种蒙古文编码自动识别方法的研究
【6h】

多种蒙古文编码自动识别方法的研究

代理获取

目录

声明

摘要

图目录

第一章 绪论

1.1 课题来源及意义

1.2 蒙古文编码识别的背景及内容

1.3 现行的主要编码系统

1.4 本文结构

第二章 相关方法与理论

2.1 蒙古文编码的多样性

2.2 蒙古文字母在词中的编码范围及编码位置规则

2.2.1 不同蒙古文的编码范围

2.2.2 蒙古文字母在单词中存在不同位置关系

2.3 单词转拉丁后分音节规则

2.3.1 字母转写拉丁

2.3.2 单词分音节处理

第三章 蒙古文不同编码识别的研究和实现

3.1 基于字母的所属范围和不同位置原则作编码识别

3.2 单词分音节规则的实现

3.2.1 蒙古文字母转换为拉丁字母的实现

3.2.2 蒙古文单词分音节处理的实现过程

3.3 将两种方法结合起来作编码识别

第四章 实验结果分析

4.1 将蒙古文单词转换为对应的蒙古文编码

4.2 基于字母范围及在词中不同位置作编码识别的实验结果

4.3 分音节原则所作蒙古文识别的实验结果

4.4 将前两种方法结合后所作的实验结果分析

第五章 总结与进一步的工作

5.1 总结

5.2 工作展望

参考文献

致谢

展开▼

摘要

随着计算机技术和网络技术的飞速发展,蒙古文信息处理的工作也取得了很大的进步。但是由于蒙古文国际标准编码出台的相对滞后,目前市场上各种软件厂商采取自己的编码标准,使得各种蒙古文资料、网站之间不能兼容,信息不能共享,从而严重影响了蒙古文信息处理工作的发展。因此将不同厂商的蒙古文编码转换为统一的编码标准就成为了一项重要的工作。
  多种蒙古文编码自动识别工作是在不确定所属编码类型的情况下所做的识别工作,属于编码转换的前期工作,是下一步编码转换工作的基础。
  本文主要对智能、蒙科立、明安图三种编码规则做了分析后采用两种方法来做编码识别工作。一种方法是根据蒙古文字母所属范围和在单词不同位置所表示的字型及编码不同来做的识别;另一种方法是采用蒙古文单词转拉丁后分音节而作的蒙古文识别。
  在具体的研究过程中,本文分别对蒙古文三种编码所属的编码范围、蒙古文编码的词首、词中、词末及独立形式做了深入研究并做了初步划分。此外还深入研究蒙古文的拉丁转写规则,对三种编码的蒙古文字母做了拉丁转写工作。本文还对蒙古文的分音节理论做了深入研究,根据分音节的规则,画出了蒙古文单词分音节划分流程图,并用该流程图对三种蒙古文编码的拉丁形式分别进行了分音节识别工作。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号