首页> 中文学位 >多字体印刷蒙文字识别技术的研究
【6h】

多字体印刷蒙文字识别技术的研究

代理获取

目录

文摘

英文文摘

第一章序言

1.1 OCR技术的发展

1.2文字识别系统概览

1.2.1文字识别的原理

1.2.2光学字符识别方法

1.2.3实现数据自动录入的几种技术手段的比较

1.2.4 OCR技术的应用

1.3 OCR技术的展望

第二章用于文字识别的模式识别技术

2.1统计模式识别技术

2.1.1统计方法的特征提取

2.1.2统计方法的特征选择

2.1.3分类器的设计

2.1.4统计模式识别在汉字识别中的应用

2.2结构模式识别技术

2.2.1模式基元的选择

2.2.2句法分析

2.2.3结构模式识别在汉字识别中的应用

2.3人工神经网络

2.3.1神经网络模式识别的方法及特点

2.3.2神经网络模式识别方法

2.3.3神经网络模式识别特点

2.3.4神经网络模式识别分类器概述

第三章印刷体文字识别

3.1文字识别概述

3.2印刷体文字识别技术

3.2.1印刷体文字识别的处理方法及过程

3.2.2用于印刷体文字识别的模式识别方法

3.3印刷体汉字识别技术

第四章多字体印刷蒙古文字识别系统的实现

4.1蒙古文字特点的分析

4.2蒙古文字识别的系统框图及工作流程

4.2.1系统框架图

4.2.2蒙文图像的预处理

4.2.3蒙文图像的版面分析和理解

4.2.4蒙文单字图像的识别处理

4.2.5识别结果的编辑修改及后处理

4.3蒙文文本图像的行字切分

4.3.1行切分

4.3.2字切分

4.4特征选择与提取

4.4.1定位主干线

4.4.2特征选择与提取

4.4.3编辑修改识别结果及后处理

4.5实验结果及程序界面外观图

4.5.1实验结果

4.5.2程序界面外观图

第五章进一步的工作

5.1其它关键技术

5.2基于多代理(Multi-Agent)多字体混排识别

5.2.1系统框架结构

5.2.2系统协同工作流程

5.3展望

5.3.1从识别角度

5.3.2用户界面和自动化方面

5.3.3其它方面

第六章结束语

研究生期间发表论文

致谢

参考文献

展开▼

摘要

文字识别是集模式识别、人工智能与文字处理于一体的高新技术,能自动地把文字或其他信息通过智能识别输入计算机,用以代替人工输入.文字识别不仅有广泛的应用领域,而且也促进了模式识别、文字处理技术的发展.该领域一直是国际上计算机智能技术的研究热点,也是中国高技术研究计划(863计划)重点支持的主题.蒙古文是内蒙古自治区的主体民族语言,在中国,使用蒙古文的地区除了内蒙古自治区,还有黑龙江、吉林、辽宁、新疆等省和自治区.目前,大部分输入方法的研究集中在键盘编码输入方式上,对蒙文字识别的研究非常少,关于印刷体蒙文识别输入的研究还是一个空白点,这严重地制约了信息技术在少数民族地区的普及和应用.针对这种现状,我们提出研制多字体印刷蒙文识别系统,为蒙古文的输入提供一种智能的输入方式,这对继承和发展少数民族文化、促进民族地区的社会进步具有重要的意义.蒙文在内蒙古自治区使用广泛,但输入均使用键盘编码输入方式,蒙文自动识别输入还是一个空白点.因此该课题的研究为蒙文输入提供了一种新的自动化和智能的方式,使蒙文信息处理达到一个新的水平.蒙古文字是拼音文字,但其书写方式在当今世界是非常独特的,与汉文和西文有很大不同.蒙文是从左到右、从上到下竖写,每个词中所有字母连着写,形成一个竖直的主干线,且每一个字母在一个词中的词首、词中和词尾所取的字形不一样.这些特点给蒙文的识别带来很大的困难.因而在研究的过程中,我们不仅要充分消化和吸收西文和汉文识别所采用的技术,还要结合蒙文书写的特点有所创新,才能较好地解决所遇到的困难.研究课题的目的是:从文字识别的角度来研究蒙文字特征的选择及特征提取、基元分割、匹配等一系列问题,开发出一个有良好人机界面,操作方便的多字体印刷蒙文识别系统.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号