首页> 中文学位 >基于小波变换的印刷体汉字字体识别研究
【6h】

基于小波变换的印刷体汉字字体识别研究

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1字体识别的提出及意义

1.2字体识别研究的发展

1.3本文内容的主要安排

1.4本论文的主要工作

第二章小波分析的理论基础

2.1小波分析的发展概况

2.2小波变换

2.2.1多分辨率分析

2.2.2 Mallat算法

2.3常用小波函数

第三章汉字字体的特征及字体识别的预处理

3.1汉字字体的特征

3.2汉字字体识别的预处理

3.2.1图像的输入

3.2.2图像的预处理

3.3小结

第四章印刷体汉字的单字符特征提取

4.1字符图像的小波分解

4.2字符图像的特征分析

4.3字符图像字体特征的提取

4.3.1特征提取的方法分析

4.3.2字符图像的能量分析

4.3.3字符图像的特征提取

4.4小结

第五章印刷体汉字单字字体识别器的设计

5.1BP神经网络简介

5.2BP神经网络的基本算法

5.2.1 BP神经网络的基本算法推导

5.2.2 BP神经网络的基本算法相关性参数说明

5.2.3基于BP神经网络的字体识别算法描述

5.3实验的结果

5.3.1实验样本的选择

5.3.2识别结果

5.4结论

第六章结束语

参考文献

发表论文和科研情况说明

致谢

展开▼

摘要

随着科学技术的进步,现代社会已进入高速发展的信息时代,纸质文档的处理量与日俱增,目前处理这类纸质文档最有效的方法是将文档的信息自动录入到计算机制成便于保存和传输的电子文档,即原文重现。文档字符识别(OCR)和字体识别是实现原文重现的两项主要的关键技术,其中字符识别技术的研究起步较早,目前已趋于成熟,然而字体识别的研究却并未受到足够地重视,研究尚处在初级阶段,但字体信息为版面分析、理解和恢复提供了重要依据,为此本文在现有研究基础上,针对汉字印刷体字体识别展开了研究。本论文的研究工作为进一步完善字体识别技术做了有益地尝试,部分研究成果具有很强的潜在应用价值。 本文设计了一个印刷体汉字字体识别系统。算法设计主要思想:1)利用构成汉字的笔画可以由四种基本笔段组成(横、竖、撇、捺),而不同字体在笔段上存在明显差异;2)利用小波变换具有很好的局部方向分析的能力,便于提取基本笔段的字体特征。基于以上分析,本文提出了基于小波分析的标准汉字字体识别的新方法。 算法的实现步骤如下:首先,对汉字的字符图像进行小波分解;然后,依据汉字的字型特点,在分解的各子图像上提取汉字基本笔段(横、竖、撇、捺)的能量特征及能量比例特征:最后,依据提取的字体特征进行分类识别,分类器采用BP神经网络。在包含六种常用字体的样本集上进行了测试,结果表明本文提出的算法能够对单字符字体进行有效地识别。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号