基于字素分割的蒙古文手写识别研究

范道尔吉; 高光来; 武彗娟

首页> 中文期刊>中文信息学报 >基于字素分割的蒙古文手写识别研究

基于字素分割的蒙古文手写识别研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

隐马尔科夫模型(HMM)对序列数据有很强的建模能力,在语音和手写识别中都得到了广泛的应用.利用HMM研究蒙古文手写识别,首先需要解决的问题是手写文字的序列化.从蒙古文的构词和书写特点看,蒙古文由多个字素从上到下串联构成.选择字素集合和词的字素分割是手写识别的基础,也是影响识别效果的关键因素.该文根据蒙古文音节和编码知识确定了蒙古文字母集合,共包括1171个字母.通过相关性处理、H M M排序筛选等手段得到长字素集合,共包括378个字素.对长字素经过人工分解,获得了50个短字素.最后利用两层映射给出了词转字素序列的算法.为了验证长短字素在手写识别中的效果,我们在HTK(hidden Markov model tool-kit)环境下利用小规模字库实现了手写识别系统,实验结果表明短字素比长字素有更好的性能.文中给出的字素集合和词转字素序列的算法为后续基于HMM的蒙古文手写识别研究奠定了基础.%Hidden Markov Models(HMM ) has strong modeling capabilities for sequence data,and it is widely used in speech recognition and handwriting recognition task.HMM-based Mongolian handwriting recognizers require the data to be analyzed sequentially.According to Mongolian word formation and writing style,it is evident that a Mon-golian word consists of grapheme seamless connected from top to down.The selection of grapheme and segmentation word to grapheme is a preliminary work for handwriting recognition with substantial effects on recognition accuracy. In this paper,according to knowledge of syllables and coding,we collect a Mongolian letters set of 1171 letters. The long grapheme set which contain 378 grapheme is then extracted from letters set by correlation process and HMM based sorting method.The short grapheme set which contain 50 shapes is extracted from long grapheme set via decompose long grapheme by hands.We present an algorithm to decompose a word to grapheme by two layers mapping.Experimental results show that the short grapheme get better performance than long grapheme.

著录项

来源
《中文信息学报》|2017年第5期|74-80|共7页
作者
范道尔吉; 高光来; 武彗娟;
展开▼
作者单位

内蒙古大学计算机学院,内蒙古呼和浩特010021;

内蒙古大学计算机学院,内蒙古呼和浩特010021;

内蒙古大学电子信息工程学院,内蒙古呼和浩特010021;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
蒙古文; 字素; HMM; 手写识别;

相似文献

中文文献
外文文献
专利

1. 蒙古文识别文本后处理字素合并模块的实现 [J] . 包艳花 . 内蒙古民族大学学报 . 2009,第006期
2. 基于蒙古文编码国家标准的蒙古文字体比较研究 [J] . 斯日古楞 . 内蒙古社会科学：蒙文版 . 2017,第004期
3. 基于CRNN的中文手写识别方法研究 [J] . 石鑫 ,董宝良 ,王俊丰 . 信息技术 . 2019,第011期
4. 基于k-邻近算法的手写识别系统的研究与实现 [J] . 辛英 . 电子设计工程 . 2018,第007期
5. 基于神经网络的联机手写识别系统的研究和实现 [J] . 周珍娟 . 电子技术与软件工程 . 2014,第005期
6. 藏文手写识别中相似字区分的研究 [C] . 孙嫣 ,吴健 . 第十二届全国少数民族语言文字信息处理学术研讨会 . 2009
7. 基于整词的蒙古文在线手写识别研究与实现 [A] . 杨帆 . 2021

基于字素分割的蒙古文手写识别研究

摘要

著录项

相似文献

相关主题

期刊订阅