首页> 中文学位 >基于极限学习机的脱机手写体汉字识别研究
【6h】

基于极限学习机的脱机手写体汉字识别研究

代理获取

目录

声明

摘要

第1章 绪论

1.1 概述

1.2 研究的背景

1.3 研究的意义

1.4 研究的难点

1.5 本文研究重点及论文内容安排

第2章 手写体汉字图像预处理

2.1 图像数字化处理

2.1.1 图像灰度化

2.1.2 图像二值化

2.2 平滑去噪处理

2.3 归一化处理

2.3.1 汉字切分

2.3.2 归一化模型

2.4 细化处理

2.5 本章小结

第3章 脱机手写体汉字的特征提取

3.1 汉字特征提取标准

3.2 汉字特征提取方法

3.2.1 基于结构特征提取方法

3.2.2 基于统计特征提取方法

3.2.3 基于统计与结构相结合的特征提取方法

3.3 基于弹性网格的特征提取算法

3.3.1 弹性网格构造

3.3.2 基于汉字骨架特征的四方向分解算法

3.3.3 基于弹性网格方向像素概率分布特征的提取

3.4 本章小结

第4章 基于极限学习机的汉字分类模型

4.1 人工神经网络

4.2 极限学习机

4.2.1 极限学习机理论

4.2.2 极限学习机的优势

4.2.3 基于极限学习机的汉字识别过程

4.3 基于极限学习的优化改进模型

4.3.1 投票机制

4.3.2 基于投票机制的极限学习机算法

4.3.3 最优投票极限学习机

4.3.4 针对混淆类的后处理方法

4.4 本章小结

第5章 脱机手写体汉字识别实验分析

5.1 极限学习机在MATLAB中的实现

5.2 实验环境与实验设计

5.2.1 实验环境

5.2.2 实验系统设计

5.3 实验结果与分析

5.3.1 训练时间与测试时间分析

5.3.2 ELM与OV-ELM性能对比分析

5.3.3 均匀网格与弹性网格性能对比分析

5.3.4 OV-ELM加入RCC后处理性能分析

5.3.5 实验结果

5.4 本章小结

第6章 总结与展望

参考文献

致谢

展开▼

摘要

作为汉字自动输入技术之一的汉字识别技术是汉字信息处理的重要接口技术。它能在信函分拣、银行支票识别、统计报表处理以及手写文稿的自动输入等诸多方面发挥巨大的作用。然而,由于手写体汉字的书写随意性很大,在整个字符识别领域中,手写体汉字识别的难度较大,成为该领域最具有挑战性的课题。
  本文主要研究内容为:汉字图像预处理,汉字特征向量的提取,重点研究了极限学习机ELM(Extreme Learning Machine)的改进算法最优投票极限学习机OV-ELM(Optimal Voting ELM)在汉字识别中的应用。
  本文首先对汉字图像的预处理技术进行了分析,包括对样本图像的归一化、平滑去噪、字符切分、二值化、汉字细化处理等。在分析现有特征提取方法的基础上,针对小字符集汉字识别的特点,本文利用弹性网格方向像素概率分布的特征提取方法,提取用于极限学习机分类器输入的特征向量;在分类器设计中,本文设计了基于最优投票机制的极限学习机优化算法OV-ELM,利用OAO(One-against-one)或者OAA(One-against-all)的思想,将一个多分问题降解为多个二分问题来提高分类的准确率,并且OV-ELM优化了传统的投票机制,对投票值以概率的方式给出,从而避免了得票数相同情况的发生。
  从本文设计的一系列实验的结果可以看出,本文提出的基于弹性网格汉字特征提取方法在特征向量提取方面效果良好,采用OV-ELM算法虽然相比ELM算法牺牲了一定的训练时间,但仍旧远远优于传统BP神经网络,并且在分类的准确率等方面的性能超过了ELM、支持向量机。整体分类框架在脱机手写体汉字识别方面取得了令人满意的分类性能。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号