首页> 中文学位 >联机无约束手写体汉字词组切分研究
【6h】

联机无约束手写体汉字词组切分研究

代理获取

目录

文摘

英文文摘

声明

第一章 绪论

1.1汉字识别的发展历程与现状

1.1.1字符识别的历史回顾

1.1.2研究现状

1.2词组识别系统简介

1.3课题研究背景和意义

1.4主要研究工作及内容安排

第二章汉字切分方法综述

2.1基于统计特征的切分方法

2.2基于汉字结构的切分方法

2.3基于连通域分析的方法

2.4基于识别的方法

2.5整体识别的方法

2.6本章小结

第三章笔矢量特征与笔速度特征

3.1笔矢量特征(Stroke Vector Feature)

3.2笔速度特征(Stroke Speed Feature)

3.3实验样本简介

3.3.1常用手写体样本数据库

3.3.2实验室手写词组数据库

3.4实验结果及分析

3.4.1对新切分特征的探索

3.4.2实验流程简介

3.4.3笔矢量特征切分结果及分析

3.4.4笔速度特征切分结果及分析

3.4.5与直方图投影对比结果

3.4.6对笔矢量特征的思考

3.5本章小结

第四章基于识别的切分方法

4.1系统概述

4.1.1系统切分过程简介

4.1.1系统流程图

4.2预处理

4.2.1参数估计

4.2.2图像增强

4.3粗切分

4.4归一化

4.4.1线性归一化

4.4.2非线性归一化

4.5特征提取选择与识别

4.5.1特征提取

4.5.2特征选择

4.5.3距离分类器

4.6动态规划算法(Dynamic Programming)

4.6.1算法概述

4.6.2字符切分中的应用

4.6.3置信度简介

4.7系统实现

4.8实验结果及分析

4.9本章小结

结论

参考文献

攻读硕士学位期间取得的研究成果

致谢

展开▼

摘要

目前,汉字识别技术已经取得了极大的进步,市场上也出现了不少成熟的汉字识别产品,然而,该领域仍然存在着很多难点问题有待我们去研究解决,联机无约束手写体汉字词组识别就是其中之一。联机无约束手写体词组识别的书写区域没有方框限定,并且每次都是输入一个词组,这无疑更符合书写者的书写习惯,也使书写者书写的更流畅更快捷。但是,如何进行联机手写体字符的切分仍然是个未解决的难题,以往的字符切分方法注重于脱机字符的切分,对联机字符切分方法的探索还非常的少。 本文在总结以往字符切分方法的基础上,对大量联机无约束手写体汉字词组样本开展切分方面的研究,提出了基于笔矢量特征(Stroke Vector Feature)和笔速度特征(StrokeSpeed Feature)的新型联机字符切分方法。论文的主要工作包括以下几个方面: ◆介绍和总结了以往字符切分的常用方法,包括基于统计特征的切分方法、基于汉字结构的切分方法、基于连通域分析的方法、基于识别的方法和整体识别的方法,并对各种方法的优缺点进行分析,指出了各方法的应用范围。 ◆研究了大量的联机无约束手写体汉字词组样本,并在实验的基础上提出了两种字符切分特征--笔矢量特征和笔速度特征。切分实验结果表明,这两种特征运算复杂度低,均能以较高的效率提出切分候选线,适合放在粗切分阶段,尤其是笔矢量特征,切分准确率较高,并对以往字符切分中的粘连、交叠和重叠等难点问题比较有效。 ◆对笔矢量特征深入分析,得出笔矢量特征能以较高概率找到前一个汉字最后一笔的结论,并且用实验进行了验证。在此基础上提出找最后一笔之后前向恢复的切分算法,并探索出一种利用标注最后一笔来测试联机字符切分准确率的方法。 ◆将笔矢量特征应用于切分系统的粗切分阶段,完成和实现了基于识别的联机无约束手写体汉字词组切分系统,并对系统各个部分所用到的技术进行了详细的介绍。实验结果表明,笔矢量特征适合于放在粗切分阶段,基于识别的切分是一种非常有前景的字符切分方法。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号