首页> 中文学位 >基于二叉树多层分类SVM的脱机手写体汉字识别方法研究
【6h】

基于二叉树多层分类SVM的脱机手写体汉字识别方法研究

代理获取

目录

文摘

英文文摘

论文说明:图表目录

声明

致谢

第一章绪论

1.1汉字识别研究概述

1.2汉字识别研究的发展历程及现状

1.2.1汉字识别研究的发展进程

1.2.2汉字识别的研究现状

1.3脱机手写体汉字识别的难点

1.4脱机手写体汉字识别的研究热点

1.5本课题的研究意义及论文内容安排

1.5.1课题研究意义

1.5.2论文内容安排

第二章支持向量机理论及其核参数优化

2.1支持向量机理论

2.1.1支持向量机的分类原理

2.1.2支持向量机核函数的参数选择

第三章脱机手写体汉字的粗分类二叉树结构

3.1汉字粗分类二叉树结构设计

3.1.1基于汉字复杂度的分类

3.1.2基于字型结构的分类

3.1.3基于外围边框类型的分类

第四章脱机手写体汉字图像的特征提取及融合

4.1粗分类中的手写体汉字特征提取方法

4.1.1粗网格特征提取

4.1.2直方图结构统计特征提取

4.1.3四周面积编码特征提取

4.2细分类中的手写体汉字特征提取方法

4.2.1二维小波网格特征

4.2.2笔划密度特征

4.2.3笔划方向特征

4.3手写体汉字特征的多特征融合

4.3.1细分类识别中的多特征融合

第五章脱机手写体汉字识别的算法研究

5.1脱机手写体汉字的SVM二叉树算法

5.1.1基于支持向量机的二叉树粗分类算法

5.1.2汉字识别算法

5.2脱机手写体汉字的多特征融合算法

第六章脱机手写体汉字识别的仿真研究

6.1汉字图像库的建立

6.2汉字图像的预处理

6.2.1图像的切分

6.2.2图像的归一化

6.2.3图像的细化

6.3基于SVM的汉字二叉树粗分类

6.4汉字细分类识别

第七章总结与展望

参考文献

攻读硕士学位期间发表的论文

展开▼

摘要

汉字识别一直是模式识别最重要的研究领域之一,具有广泛的应用前景。经过多年的研究,已经取得了大量成果。但是,无约束的非特定脱机手写体汉字识别仍然被认为是文字识别领域最困难的问题之一,其原因可以归结为:相似汉字较多,且有些相似字差别极其细微;存在大量的不规则书写变形。
   支持向量机(Support Vector Machines-SVM)已经在模式识别、回归分析和特征选择等方面得到了较好的效果。本文以脱机手写体汉字识别为研究对象,首先根据一种判定汉字复杂程度的标准,对汉字进行初步粗分类,然后分别基于汉字的字型结构和外围边框类型对汉字进一步粗分类,最后将汉字分为9种类型,生成了一个二叉分类树。根据二叉树叶子节点中的汉字集类型,选择不同的混合特征作为各组SVM分类器的输入,采用“一对一”方法进行最终的细分类识别。具体做了以下几方面的研究工作:
   (1)汉字粗分类二叉树的构造。依据手写体汉字笔划数和复杂度之间的关系,进行初步粗分类;研究了手写体汉字的字型结构以及外围边框特点,进一步对汉字集进行粗分类,从而构造出一个手写体汉字粗分类二叉树,实现了基于汉字复杂度、字型结构和边框类型的多级粗分类。
   (2)SVM核函数参数寻优方法的改进。依据核校准理论,对一种核参数的优化选择方法进行了改进,利用改进后的方法在训练前对训练样本进行聚类,以获得核参数。
   (3)脱机手写体汉字的特征提取及融合方法的研究。依据二叉树粗分类中不同汉字集的不同特点,利用不同的特征作为各个SVM分类器的输入;同样依据细分类中不同汉字集的不同特点,选取不同特征并对其融合形成新的特征,作为各个“一对一”SVM分类器的输入,进行细分类识别。
   (4)选取SCUT-IRAC库中的手写体汉字作为仿真样本,以MATLAB7.0为仿真工具进行了仿真分析。
   仿真结果表明:本文提出的这种新的二叉树SVM粗分类方法与“一对一”SVM细分类相结合的分类识别策略,充分发挥了二叉树分类速度快和SVM分类正确率高的优点,取得了较好的效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号