脱机中文手写识别—–从孤立汉字到真实文本
Off-line Recognition of Chinese Handwriting:From Isolated Character to Realistic Text
摘 要
Abstract
目 录
Contents
第 1 章 绪论
1.1 课题背景及意义
1.2 脱机文字识别发展历史
1.2.1 OCR研究的探索期
1.2.2 OCR研究的蓬勃发展期
1.2.3 汉字识别的黄金时期
1.2.4 OCR研究趋向部分成熟时期
1.3 脱机手写汉字识别的发展趋势
1.3.1 中英文脱机手写识别的研究策略对比
1.3.2 中英文脱机手写库对比
1.3.3 脱机手写汉字识别发展趋势分析
1.4 已有技术评述
1.4.1 预处理
1.4.2 特征提取
1.4.3 分类器设计
1.4.4 后处理
1.5 文章内容和组织结构
第 2 章 真实手写文本的采样机制及有效性验证
2.1 采样策略
2.2 手写样本收集
2.2.1 数据分割与版式设计
2.2.2 打印、分发和收集样本
2.3 手写样本处理
2.3.1 挑选、扫描与二值化
2.3.2 手写文本行分割
2.3.3 文本真值标注
2.3.4 HIT-MW库的组织结构
2.4 手写样本的统计和有效性验证
2.4.1 基本信息统计
2.4.2 涂改与误写分析
2.4.3 标点误写的统计与推断
2.5 HIT-MW库的适用范围
2.6 小结
第 3 章 中文手写文本识别的评价和基于切分策略的研究
3.1 实验数据集
3.2 文本识别的评价准则
3.3 汉字切分评述
3.3.1 Hong算法
3.3.2 Liu算法
3.3.3 字符切分的评价准则
3.4 最优手写矫形配置的新结论
3.4.1 相关特征提取算法
3.4.2 相关高斯分类器
3.4.3 实验配置
3.4.4 实验结果
3.5 改进MQDF分类器
3.5.1 实验配置
3.5.2 实验结果
3.6 小结
第 4 章 基于无切分策略的中文真实手写文本识别
4.1 理论框架及意义
4.2 滑动窗
4.3 常用特征提取方法的引入
4.3.1 网格特征
4.3.2 四方向平面交叉特征
4.3.3 梯度特征
4.3.4 Gabor特征
4.3.5 Cross特征
4.4 HMM训练与解码
4.5 常用特征在无切分框架下的实验
4.5.1 实验配置
4.5.2 实验结果
4.6 从缓解数据不足角度提升系统性能
4.6.1 实验配置
4.6.2 实验结果
4.6.3 结果分析
4.6.4 错误分析
4.6.5 与切分系统在识别率上的比较
4.6.6 与切分系统在运行时间和内存占用上的比较
4.7 从改进特征角度提升系统性能
4.7.1 en-FPF在无切分框架下的描述
4.7.2 重新实验的结果
4.7.3 与修改前系统的比较
4.8 小结
第 5 章 基于双策略组合的中文真实手写文本识别
5.1 多分类器组合方法的评述
5.1.1 成员分类器的生成
5.1.2 组合成员分类器输出的方法
5.1.3 多分类器组合的常用组合结构
5.1.4 当前方法分析及存在的问题
5.2 CMR准则
5.2.1 CMR的定义
5.2.2 基于CMR曲线的互补性验证
5.3 基于串行结构的双策略组合系统
5.3.1 总体结构
5.3.2 字符边界的精化
5.3.3 串行组合方法的识别实验及评价
5.4 基于并行结构的双策略组合系统
5.4.1 总体结构
5.4.2 实验评价
5.5 小结
结 论
参考文献
攻读博士学位期间发表的学术论文
哈尔滨工业大学博士学位论文原创性声明
哈尔滨工业大学博士学位论文使用授权书
致 谢
个人简历