首页> 中国专利> 一种旋转方向无关的手写汉字识别方法

一种旋转方向无关的手写汉字识别方法

摘要

本发明提供了一种旋转方向无关的手写汉字识别方法,用户通过手写输入设备书写汉字,而信息处理设备将采集到的汉字字符图像转换为相应的汉字机器内码,包括如下步骤:(1)对输入字符进行旋转方向的第一次纠正,所述第一次纠正使得该输入字符的起始点位于字符图像的左上部分;(2)对输入字符进行旋转方向的第二次调整,所述第二次调整确定字符在横、45度斜方向、竖和135度斜方向四个方向上的方向主轴,并计算输入字符关于方向主轴的真实主轴,如真实主轴与方向主轴不重合,则旋转字符使之重合;(3)将经过步骤(1)和(2)纠正即调整后的字符图像通过分类器进行识别,得到字符识别结果。

著录项

  • 公开/公告号CN101697201A

    专利类型发明专利

  • 公开/公告日2010-04-21

    原文格式PDF

  • 申请/专利权人 华南理工大学;

    申请/专利号CN200910192677.9

  • 发明设计人 金连文;黄盛明;吕锦;

    申请日2009-09-25

  • 分类号G06K9/68;G06K9/32;

  • 代理机构广州粤高专利商标代理有限公司;

  • 代理人何淑珍

  • 地址 510640 广东省广州市天河区五山路381号

  • 入库时间 2023-12-17 23:44:22

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-11-11

    未缴年费专利权终止 IPC(主分类):G06K9/68 授权公告日:20120530 终止日期:20140925 申请日:20090925

    专利权的终止

  • 2012-05-30

    授权

    授权

  • 2010-06-02

    实质审查的生效 IPC(主分类):G06K9/68 申请日:20090925

    实质审查的生效

  • 2010-04-21

    公开

    公开

说明书

技术领域

本发明属于利用计算机模式识别技术进行手写汉字识别的技术领域,特别是涉及一种旋转方向无关的手写汉字识别方法。

背景技术

手写汉字识别一般是指用户通过手写输入设备(比如:手写板、触摸屏、鼠标等)书写汉字,同时计算机将手写输入设备采集到的汉字书写轨迹转换为相应的汉字机器内码的识别技术。传统的手写识别技术通常所采用的输入方式为单字符识别,但是这些传统的手写识别输入法并不是旋转无关的,它要求用户书写的字符倾斜不能超过一定角度,不然它的识别率将得不到保证,一般来说,当输入的字符倾斜超过30度后输入的字符往往不能正确识别,也就是说对于这些倾斜字符而言,传统的输入法的识别率是很低的,这就限制了用户手写输入的方向,不能满足用户自由书写的需要。

发明内容

本发明的目的在于克服上述手写汉字识别方法的不足,提供一种更自由的手写汉字输入识别方式,即旋转方向无关单字识别。

本发明采用的技术方案为:

一种旋转方向无关的手写汉字识别方法,用户通过手写输入设备书写汉字,而信息处理设备将采集到的汉字字符图像转换为相应的汉字机器内码,包括如下步骤:

(1)、对输入字符进行旋转方向的第一次纠正,所述第一次纠正使得该输入字符的起始点位于字符图像的左上部分;

(2)、对输入字符进行旋转方向的第二次调整,所述第二次调整确定汉字字符在横、45度斜方向、竖和135度斜方向四个方向上的方向主轴,并计算输入字符的真实主轴,如真实主轴与方向主轴不重合,则旋转字符使之重合;

(3)、将经过步骤(1)和(2)纠正即调整后的字符图像通过分类器进行识别,得到字符识别结果。

上述技术方案中,所述步骤(1)具体包括如下步骤:

(11)、计算输入字符的重心;

(12)、以字符重心为原点画水平与垂直划分线将字符图像切分为四个部分,分别为左上、右上、左下、右下部分;

(13)、如果输入字符的起始点不在字符图像的左上部分,则旋转字符图像使得起始点位于图像的左上部分。

所述步骤(2)包括如下步骤:

(21)将输入字符所有时序点的方向向量投影在横、45度斜方向、竖、135度斜方向四个方向上;

(22)选取横、45度斜方向、竖、135度斜方向四个方向轴上投影长度最长的方向轴作为该字符的方向主轴,方向主轴表明了该字符主要的笔画方向;

(23)根据公式计算字符关于方向主轴的真实主轴方向

其中S表示在方向主轴上投影长度不为0的方向向量集合,θj表示第j个方向向量相对于方向主轴的角度,Lij表示第j个方向在方向主轴上的投影,SLi表示方向主轴上的投影长度和;

(24)旋转字符图像,使得字符的真实主轴与方向主轴重合从而将字符图像旋转到横、或45度斜方向、或竖、或135度斜方向上;

所述第j个时序点的方向向量定义如下,,其中Pj表示输入的第j个时序点,Pj-1表示输入的第(j-1)个时序点,Pj+1表示输入的第(j+1)个时序点:

所述时序点在横、45度斜方向、竖、135度斜方向上的投影向量定义为:

Lj={L1j,L2j,L3j,L4j};

所述横、45度斜方向、竖、135度斜方向主轴上的投影长度向量定义为:

SL={SL1,SL2,SL3,SL4}.

所述方向主轴指的是在横、45度斜方向、竖、135度斜方向四个方向轴上所有时序点的方向向量投影长度和最大的方向轴,由于时序点的方向向量表征了当前笔画的方向,将其投影到横、45度斜方向、竖、135度斜方向四个方向轴上,计算所有时序点在这四个方向上的投影长度和,则四个方向上投影和最大的方向就表征了该字符在横竖撇捺四个方向上的主要的笔画方向,也就是说,方向主轴是当前字符在横竖撇捺四个方向上的主要的笔画方向。

所述关于方向主轴的真实主轴指的是根据那些在当前字符的方向主轴上有投影长度的时序点方向向量计算的相比于方向主轴更为精确的字符笔画方向。由于方向主轴只是表征了当前字符在横竖撇捺四个方向上的主要的笔画方向,它并不能精确的描述字符的具体的笔画方向,根据时序点方向向量在方向主轴上的投影长度及其角度计算的方向轴更能体现出当前字符的笔画方向,故称根据公式计算出来的方向为字符的真实主轴方向,因为它更体现出当前字符的笔画方向。

本发明所述步骤(3)将训练样本多次旋转作为新的样本去训练分类器,即把训练样本集经过人为旋转样本,以及步骤(1)和(2)的纠正及调整后,提取训练样本的方向特征,并生成识别字典,以该识别字典构成分类器。

本发明通过步骤(1)的初次纠正,以及步骤(2)的再次调整,再结合有效的分类器进行识别,使得用户手写的汉字可以不受方向的约束,即无论用户所写的汉子如何倾斜,均可有效识别,使得手写汉字的识别领域具有更大的应用,也更进一步方便了用户的使用。

附图说明

图1是本发明的系统结构框图;

图2是本发明的基于起始点的字符角度纠正的流程框图;

图3是对汉字起始点分布统计图;

图4是对具体手写样本的基于起始点的字符角度纠正示例;

图5是本发明的基于汉字主轴信息的二次角度调整的流程框图;

图6是对具体手写样本的基于汉字主轴信息的二次角度调整示例。

具体实施方式

下面结合附图对本发明做进一步的说明,实施本发明所用的识别设备可以采用手写板书写汉字,用计算机进行识别,用纯平型显示器显示用户图形界面,可采用C++语言编制各类处理程序,便能较好地实施本发明。本发明也能在PDA等手持设备上实现。

本发明的系统结构框图如附图1所示,中文手写字符笔画的时序点输入后,首先对输入字符进行基于起始点的字符角度纠正,然后是基于汉字主轴信息的字符角度二次调整,将经过角度纠正调整后的字符通过由旋转多样本方法训练的分类器识别,最后得到字符识别结果。

本发明的字符角度初次纠正方法为基于起始点的字符角度纠正,其流程图如附图2所示,具体步骤如下:

(A)、计算输入字符的重心;

(B)、以字符重心为原点画水平与垂直划分线将字符图像切分为四个部分;

(C)、如果起始点不在字符图像的左上部分,则旋转字符图像使得起始点位于图像的左上部分。

上述的方法是基于一个这样的观察事实,对于大多数汉字而言,它的起始点都是位于字符图像的左上部分。基于863联机手写数据库的60套样本,对GB一级汉字包含的3755个汉字的起始点分布进行了统计,起始点分布图如图3所示,图中蓝色位置表示起始点最密集的位置,统计的起始点数以蓝色位置为中心向四周递减。该分布图证实了上述的关于“对于大多数汉字而言,它的起始点都是位于字符图像的左上部分”的假设,从而提供了基于起始点的字符角度纠正方法的理论根据。

对于具体的一个倾斜书写的手写样本“啊”的基于起始点的字符角度纠正效果如附图4(a),(b),(c),(d)所示,可以看出,不管是旋转了多大角度的倾斜字符在经过了基于起始点的字符角度纠正后,字符的旋转角度被控制在一定范围内,可以证明,相对于非倾斜字符,倾斜字符在纠正后角度倾斜不会超过135度,尤其是对于那些起始点落在非倾斜字符的左上部的字符而言,纠正后角度倾斜不会超过90度,从而有效地防止了字符出现过度倾斜的情况。

本发明的基于汉字主轴信息的二次角度调整具体实施为:

首先定义第j个时序点的方向向量其中Pj表示输入的第j个时序点,Pj-1表示输入的第(j-1)个时序点,Pj+1表示输入的第(j+1)个时序点:

定义第j个输入时序点在横,45度斜方向,竖,135度斜方向四个方向上的投影向量定义横,45度斜方向,竖,135度斜方向四个方向主轴上的投影长度向量则有

基于汉字主轴信息的角度调整如附图5所示,包括如下步骤:

(I)将输入字符所有时序点的方向向量投影在横,45度斜方向,竖,135度斜方向四个方向上。

(II)选取横、45度斜方向、竖、135度斜方向四个方向轴上投影长度最长的方向轴作为该字符的方向主轴,方向主轴表明了该字符主要的笔画方向;

(III)根据公式计算字符关于方向主轴的真实主轴方向

其中S表示在方向主轴上投影长度不为0的方向向量集合,θj表示第j个方向向量相对于方向主轴的角度,Lij表示第j个方向在方向主轴上的投影,SLi表示方向主轴上的投影长度和;

(IV)将字符的真实主轴旋转到与方向主轴重合从而将字符旋转到横,45度斜方向,竖,135度斜方向这四个方向上。

该方法可以有效的将汉字旋转到横,45度斜方向,竖,135度斜方向这四个方向上,从而减少了输入字符的角度的变化范围,为下面的识别奠定了基础。

对于具体的一个倾斜书写的手写样本“啊”,在其经过了基于起始点的字符角度纠正后,再经过基于汉字主轴信息的二次角度调整后的效果如附图6(a),(b),(c),(d)所示,图6(a),(b),(c),(d)左边的汉字对应于附图4(a),(b),(c),(d)所显示的初次纠正后的汉字,右边是经过基于汉字主轴信息的二次角度调整后的结果。

本发明的旋转多样本分类器训练方法具体实施为将训练样本多次旋转作为新的样本去训练分类器。该方法的实施是为了使得分类器可以适应于倾斜的样本,实验证明,旋转多样本训练分类器的方法是有效的。用N表示每个样本的旋转次数,A表示每次旋转的角度的集合,N=10,A=[-45,45]度内随机旋转的十次角度的参数设置在实验中的性能是最好的。

将本发明应用于旋转无关的单字识别,其结果示于下表1-3,其中表1是传统方法与本发明方法在863联机数据库上对一级汉字前500类汉字的识别率对比实验结果;表2是本发明方法在863联机数据库上对一级汉字前500类汉字各种旋转角度下的识别率;表3是传统方法与本发明方法在SCUT-COUCH联机数据库(SCUT-COUCH联机数据库是由华南理工大学人机交互智能接口实验室所采集的联机手写汉字数据库,样本数为168套)上对一级汉字共3755类汉字的识别率对比实验结果。表1与表2中的训练集样本数为45,测试样本数为15。表3中的训练集样本数为132,测试集样本数为36。由表1,3可以看出,本发明相比于传统的单字识别方法,大大提高了倾斜汉字的识别率,并且,由表2可以看出,本发明是稳定的,对于任意倾斜角度的汉字均能很好的识别。

表1

表2

表3

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号