基于二叉树多层分类SVM的脱机手写体汉字识别方法研究

代理获取

页面导航

目录
摘要
著录项
引文网络
相似文献
相关主题

摘要

汉字识别一直是模式识别最重要的研究领域之一，具有广泛的应用前景。经过多年的研究，已经取得了大量成果。但是，无约束的非特定脱机手写体汉字识别仍然被认为是文字识别领域最困难的问题之一，其原因可以归结为：相似汉字较多，且有些相似字差别极其细微；存在大量的不规则书写变形。
　　支持向量机(Support Vector Machines-SVM)已经在模式识别、回归分析和特征选择等方面得到了较好的效果。本文以脱机手写体汉字识别为研究对象，首先根据一种判定汉字复杂程度的标准，对汉字进行初步粗分类，然后分别基于汉字的字型结构和外围边框类型对汉字进一步粗分类，最后将汉字分为9种类型，生成了一个二叉分类树。根据二叉树叶子节点中的汉字集类型，选择不同的混合特征作为各组SVM分类器的输入，采用“一对一”方法进行最终的细分类识别。具体做了以下几方面的研究工作：
　　 (1)汉字粗分类二叉树的构造。依据手写体汉字笔划数和复杂度之间的关系，进行初步粗分类；研究了手写体汉字的字型结构以及外围边框特点，进一步对汉字集进行粗分类，从而构造出一个手写体汉字粗分类二叉树，实现了基于汉字复杂度、字型结构和边框类型的多级粗分类。
　　 (2)SVM核函数参数寻优方法的改进。依据核校准理论，对一种核参数的优化选择方法进行了改进，利用改进后的方法在训练前对训练样本进行聚类，以获得核参数。
　　 (3)脱机手写体汉字的特征提取及融合方法的研究。依据二叉树粗分类中不同汉字集的不同特点，利用不同的特征作为各个SVM分类器的输入；同样依据细分类中不同汉字集的不同特点，选取不同特征并对其融合形成新的特征，作为各个“一对一”SVM分类器的输入，进行细分类识别。
　　 (4)选取SCUT-IRAC库中的手写体汉字作为仿真样本，以MATLAB7.0为仿真工具进行了仿真分析。
　　仿真结果表明：本文提出的这种新的二叉树SVM粗分类方法与“一对一”SVM细分类相结合的分类识别策略，充分发挥了二叉树分类速度快和SVM分类正确率高的优点，取得了较好的效果。

著录项

作者
秦朗;
展开▼
作者单位

合肥工业大学;

展开▼
授予单位合肥工业大学;
学科检测技术与自动化装置
授予学位硕士
导师姓名朱程辉;
年度 2010
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP391.43;
关键词
汉字识别; 脱机手写体汉字; 二叉树; SVM核函数; 支持向量机;

相似文献

中文文献
外文文献
专利

1. 一种动态剪枝二叉树SVM的脱机手写体汉字识别方法研究 [J] . 徐小丽 ,范程华 ,樊敏 . 合肥师范学院学报 . 2018,第003期
2. 一种不确定性二叉树 SVM 的脱机手写体汉字识别研究 [J] . 范程华 ,徐小丽 ,蒋先伟 . 安庆师范学院学报（自然科学版） . 2013,第001期
3. 基于融合特征和LS-SVM的脱机手写体汉字识别 [J] . 高彦宇 ,杨扬 ,陈飞 . 北京科技大学学报 . 2005,第004期
4. 基于双神经网络分类器的脱机手写体汉字识别 [J] . 王歌 ,谢松云 ,党正 . 西北工业大学学报 . 2010,第004期
5. 基于改进二叉树多分类SVM的焊缝缺陷分类方法 [J] . 罗爱民 ,沈才洪 ,易彬 . 焊接学报 . 2010,第007期
6. 基于二叉树多层分类SVM的脱机手写体汉字识别 [C] . 秦朗 . 第十九届全国测控、计量、仪器仪表学术年会 . 2009
7. 基于二叉树多层分类SVM的手写体汉字识别方法研究 [A] . 张丽萍 . 2007

基于二叉树多层分类SVM的脱机手写体汉字识别方法研究

目录

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅