首页> 中国专利> 一种后桥主齿轮特殊打标形式的字符识别方法及系统

一种后桥主齿轮特殊打标形式的字符识别方法及系统

摘要

本发明公开了一种后桥主齿轮特殊打标形式的字符识别方法及系统,其中,该方法包括步骤:对后桥主齿轮特殊打标形式的字符进行预处理;采用基于任意角度的环形字符分割算法对经过预处理后的字符图像进行分割,通过将定位到的环形字符区域转换成矩形字符区域,然后逐列扫描该区域的像素点,并将其分割成单一字符;最后对分割后的图像进行识别。本发明解决了后桥主齿轮特殊打标形式的字符由于格式特殊,难以使用现有技术定位字符的问题,使用该方法能显著提高字符识别的效率,并且和现有技术相比能够降低识别的误差。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-08-14

    授权

    授权

  • 2015-12-09

    实质审查的生效 IPC(主分类):G06K9/32 申请日:20150731

    实质审查的生效

  • 2015-11-11

    公开

    公开

说明书

技术领域

本发明涉及字符识别领域,尤其涉及一种后桥主齿轮特殊打标形式的字符识别方法及系统。

背景技术

主齿轮特殊打标形式的字符位于主齿轮的一个不规则平面上。在主齿轮的轴心部分,存在一个圆形向内凹的小孔。主齿轮的字符,包括了主齿轮的各种生产信息,其中有主齿轮的出厂号,生产日期,生产批次号等等。主要由20位的字符,包括字母,数字和一个表示连接的横杠线组成。这二十位字符均匀的沿着主齿轮轴心上的圆形内凹小孔呈环形排列,每一个字符占据约15度角的扇形圆环,字符的起始位置和末尾位置之间留有约60度角的空白扇形圆环。

就目前的大多数字符识别系统,都需要待识别的字符呈线性排列,特别是在字符分割阶段,如果字符不是线性排列,比如基于投影量的分割算法等,就无法完成字符的分割了。所以主齿轮特殊打标形式的字符在主齿轮的正视图平面上呈约300度角的圆环形排列,使得字符很难用一般的分割算法来分割。主齿轮特殊打标形式的字符识别与一般的字符识别还存在区别,比如,主齿轮在热处理和打磨之后,表面毛刺较多,而且为了能够防锈,齿轮表面油污也很多;在生产车间内,由于光照不均衡,现场红紫外线较强,采集到的含有主齿轮的字符的图像中的噪声比较高;打标的字符需要适应工业生产,其字体不是标准字体,而且是以点阵的格式打标到主齿轮的表面上的,难于识别。

在一般的字符识别技术中,存在着很多问题,导致原本很有效的字符识别技术,反而不能发挥其本来的作用,变得误差很高且效率低下。在主齿轮特殊打标形式的字符图像中,如何定位到待识别的字符也是一个有挑战的问题,通常的字符识别算法要么待识别的字符在图像中的相应位置是固定的,比如扫描仪对标准打印字体的识别,要么能够依据与图像中的背景有明显区分的特定的几何图形来定位,比如在车牌识别系统中,车牌的号码是规则排列于车牌这个具有规则矩形形状的可以与背景明显区分的几何图形中。需要比较选取一种适合于主齿轮正视图平面特定形状的一种定位算法,来实现对主齿轮字符的定位。

发明内容

本发明要解决的技术问题在于针对现有技术中字符识别算法无法对后桥主齿轮特殊打标形式的字符图像进行识别的缺陷,提供一种可解决齿轮表面毛刺较多、图像噪声高、字符呈环形排列等问题的后桥主齿轮特殊打标形式的字符识别方法及系统。

本发明解决其技术问题所采用的技术方案是:

本发明的后桥主齿轮特殊打标形式的字符识别方法,包括以下步骤:

S1、获取后桥主齿轮特殊打标形式的字符图像,并对其进行预处理;

S2、对预处理后的字符图像,使用基于任意角度的环形字符分割算法进行分割处理,具体包括以下步骤:

S21、定位环形字符区域的圆心,并以该圆心为中心建立坐标系;

S22、根据半径偏移,定位到环形字符区域,用坐标旋转公式求出环形字符区域像素点的坐标,并确定起始位置坐标;

S23、从起始位置坐标开始,将环形字符区域变换成矩形字符区域;

S24、从起始位置坐标开始,逐列扫描矩形字符区域的像素点,如果出现没有字符的像素列,则对其进行分割,直到对矩形字符区域扫描完成;

S3、对分割后的单独字符图像进行识别。

所述步骤S1具体包括以下步骤:

S11、使用灰度化和高斯模糊算法,对获取到的后桥主齿轮特殊打标形式的字符图像进行降噪处理;

S12、使用Canny边缘检测算法和腐蚀膨胀算法,对降噪处理后的图像进行边缘检测和去毛刺处理。

步骤S11具体包括以下步骤:

S111、从字符图像中提取红色像素矩阵、绿色像素矩阵和蓝色像素矩阵;

S112、对三个像素矩阵中每一个元素都进行加权平均,得到灰度值矩阵;

S113、将灰度值矩阵用高斯模糊算法的权重矩阵进行加权平均,得到高斯模糊后的灰度值矩阵。

步骤S12具体包括以下步骤:

S121、利用sobel算子3*3的矩阵对主齿轮特殊打标形式的字符图像进行梯度计算,求取X和Y方向上各自的梯度,并用L2范数计算梯度的幅值,以及梯度的方向;

S122、进行非极大值抑制,把梯度的方向划为四个扇区,将像素周围对应的八个领域投射到这四个扇区,其中对称的像素分在同一个扇区上,将每一个像素点与其沿着梯度线的两个相邻像素相比,如果其梯度值小于沿梯度线的两个相邻像素梯度值,则令该像素点梯度值为0;

S123、用双阈值来对梯度矩阵进行检测,并连接边缘;

S124、对得到的二值图像,连续做多次CLOSE运算。

步骤S2中采用霍夫变换来对环形字符区域进行定位。

步骤S3中使用粒子群算法优化支持向量机算法的惩罚因子和核函数的参数对分割后的字符图像进行识别。

步骤S3具体包括以下步骤:

S31、对分割后的单一字符图像提取字符HOG特征;

S32、根据提取的HOG特征计算粒子群算法优化支持向量机的惩罚因子和核函数参数;

S33、根据计算出的惩罚因子和核函数参数选取其最优解,对字符图像进行识别。

本发明的后桥主齿轮特殊打标形式的字符识别系统,预处理单元、分割算法单元和字符识别单元,其中:

预处理单元,用于对获取的后桥主齿轮特殊打标形式的字符图像进行预处理;

分割算法单元,用于对预处理后的字符图像,使用基于任意角度的环形字符分割算法进行分割处理;

该分割算法单元具体包括:

圆心定位单元,用于定位环形字符区域的圆心,并以该圆心为中心建立坐标系;

区域定位单元,用于根据半径偏移,定位到环形字符区域,用坐标旋转公式求出环形字符区域像素点的坐标,并确定起始位置坐标;

区域变换单元,用于从起始位置坐标开始,将环形字符区域变换成矩形字符区域;

以及区域分割单元,用于从起始位置坐标开始,逐列扫描矩形字符区域的像素点,如果出现没有字符的像素列,则对其进行分割,直到对矩形字符区域扫描完成;

字符识别单元,用于对分割后的单独字符图像进行识别。

预处理单元包括:

降噪处理单元,通过使用灰度化和高斯模糊算法,用于对获取到的后桥主齿轮特殊打标形式的字符图像进行降噪处理;

边缘处理单元,通过使用Canny边缘检测算法和腐蚀膨胀算法,用于对降噪处理后的图像进行边缘检测和去毛刺处理。

字符识别单元包括:

特征提取单元,用于对分割后的单一字符图像提取字符HOG特征;

参数计算单元,用于根据提取的HOG特征计算粒子群算法优化支持向量机的惩罚因子和核函数参数;

识别单元,用于根据计算出的惩罚因子和核函数参数选取其最优解,对字符图像进行识别。

本发明产生的有益效果是:本发明提出了一种基于任意角度的环形字符分割算法,并采用这种算法对经过预处理后的后桥主齿轮特殊打标形式的字符进行分割,通过将定位到的环形字符区域转换成矩形字符区域,然后逐列扫描该区域的像素点,并将其分割成单一字符,最后对图像进行识别。本发明解决了后桥主齿轮特殊打标形式的字符由于格式特殊,难以使用现有技术定位字符的问题,使用该方法能显著提高字符识别的效率,并且和现有技术相比能够降低识别的误差率。

附图说明

下面将结合附图及实施例对本发明作进一步说明,附图中:

图1是本发明实施例的一种后桥主齿轮特殊打标形式的字符识别方法流程图;

图2是本发明实施例的基于任意角度的环形字符分割算法流程图;

图3是本发明实施例的一种后桥主齿轮特殊打标形式的字符识别系统的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

如图1所示,本发明实施例的后桥主齿轮特殊打标形式的字符识别方法包括以下步骤:

S1、获取后桥主齿轮特殊打标形式的字符图像,并对其进行预处理;

S11、使用灰度化和高斯模糊算法,对获取的后桥主齿轮特殊打标形式的字符图像进行降噪处理;

S111、从字符图像中提取红色像素矩阵、绿色像素矩阵和蓝色像素矩阵;

S112、对三个像素矩阵中每一个元素都进行加权平均,得到灰度值矩阵;

S113、将灰度值矩阵用高斯模糊算法的权重矩阵进行加权平均,得到高斯模糊后的灰度值矩阵;

S12、使用Canny边缘检测算法和腐蚀膨胀算法,对降噪处理后的图像进行边缘检测和去毛刺处理;

S121、利用sobel算子3*3的矩阵对主齿轮特殊打标形式的字符图像进行梯度计算,求取X和Y方向上各自的梯度,并用L2范数计算梯度的幅值,以及梯度的方向;

S122、进行非极大值抑制,把梯度的方向划为四个扇区,将像素周围对应的八个领域投射到这四个扇区,其中对称的像素分在同一个扇区上,将每一个像素点与其沿着梯度线的两个相邻像素相比,如果其梯度值小于沿梯度线的两个相邻像素梯度值,则令该像素点梯度值为0;

S123、用双阈值来对梯度矩阵进行检测,并连接边缘;

S124、对得到的二值图像,连续做多次CLOSE运算;

S2、对预处理后的字符图像,使用基于任意角度的环形字符分割算法进行分割处理,具体包括以下步骤:

S21、定位环形字符区域的圆心,并以该圆心为中心建立坐标系;

S22、根据半径偏移,定位到环形字符区域,用坐标旋转公式求出环形字符区域像素点的坐标,并确定起始位置坐标;

S23、从起始位置坐标开始,将环形字符区域变换成矩形字符区域;

S24、从起始位置坐标开始,逐列扫描矩形字符区域的像素点,如果出现没有字符的像素列,则对其进行分割,直到对矩形字符区域扫描完成;

S3、对分割后的单独字符图像进行识别;

S31、对分割后的单一字符图像提取字符HOG特征;

S32、根据提取的HOG特征计算粒子群算法优化支持向量机的惩罚因子和核函数参数;

S33、根据计算出的惩罚因子和核函数参数选取其最优解,对字符图像进行识别。

先对获取的字符图像进行预处理,预处理的过程包括对字符图像进行降噪处理,通过灰度化和高斯模糊算法,对采集到的主齿轮特殊打标形式的字符图像进行降噪处理。对图像先进行灰度化处理,具体的处理过程是:从字符图像中提取红色像素矩阵,绿色像素矩阵和蓝色像素矩阵;对这三个像素矩阵中每一个元素都进行加权平均,采用的权值系数为W_R=0.3,W_G=0.59,W_B=0.11;对三个像素矩阵进行加权平均后,将得到的结果矩阵赋值给RGB三色通道中的红色像素矩阵,绿色像素矩阵和蓝色像素,使得这三个像素矩阵全部等于加权平均都得到的结果矩阵。这样就得到了主齿轮特殊打标形式的字符图像的灰度化图像,同时也就得到了主齿轮特殊打标形式的字符图像的灰度值矩阵。

对主齿轮的字符图像的灰度值矩阵进行处理,对灰度值矩阵中的每一个元素都用权重矩阵进行加权平均。具体的就是将每一个元素值,用该元素值和其周围一个范围内的元素值,采用由高斯模糊得到的权重矩阵,进行加权平均运算,得到一个新的元素值,来代替原有的元素值。这样就可以用图像中一个像素点周围像素的信息来对中心像素点进行平均处理,使得整个图像变得平滑,由此可以去除图像中的噪声。

在高斯模糊算法中,σ的取值不一样,会导致算法的权重矩阵不一样,继而使得最终的处理结果也不一样,设权重矩阵的大小为5*5,计算得出权重矩阵。其中权重矩阵的大小是依据距离中心待处理的目标像素越远的像素与中心像素关联越小,所以5*5的大小相对合适。在对待图像的边缘像素时,其周围的像素可能会有缺失,因为权重矩阵是对称的,所以可以把缺失的像素用其对称的像素值代替,来计算结果。

在完成对字符图像的降噪处理后,要对其进行边缘处理,这个过程使用Canny边缘检测算法和腐蚀膨胀算法,对图像进行边缘检测和去毛刺处理。用Canny边缘检测进行处理。具体步骤是:利用sobel算子3*3的矩阵对主齿轮特殊打标形式的字符图像进行梯度计算,求取X和Y方向上各自的梯度,并用L2范数计算梯度的幅值,以及梯度的方向;进行非极大值抑制,把梯度的方向画为四个扇区,将像素周围对应的八个领域投射到这四个扇区,其中对称的像素分在同一个扇区上,将每一个像素点与其沿着梯度线的两个相邻像素相比,如果其梯度值小于沿梯度线的两个相邻像素梯度值,则令该像素点值为0值;利用双阈值来对前面处理得到的主齿轮特殊打标形式的字符图像的梯度矩阵进行检测,并连接边缘,在双阈值的选取上,采用50和200的固定阈值。

如何能有效的控制主齿轮特殊打标形式的字符图像中的毛刺显得十分重要,选择用腐蚀膨胀算法,对边缘检测后的主齿轮的字符图像进行处理。在一般的腐蚀膨胀算法中,对于毛刺的处理都是用OPEN运算来进行处理,因为其通过先对图像进行腐蚀运算,在进行膨胀运算,可以有效地将很小的像素点去除,但是由于主齿轮特殊打标形式的字符图像的特殊性,图中的轮廓都是由细小的像素点组成,特别的在图像的中心区域,圆环形的细线,如果先用了腐蚀运算那么该圆环线段将直接被抹掉,从而导致后续的处理没法继续进行。采用CLOSE运算来对主齿轮特殊打标形式的字符图像进行处理,连续做多次CLOSE运算。

图2为本发明的基于任意角度的环形字符分割算法流程图。在完成对字符图像的预处理过程后,需要对预处理后的字符图像,使用基于任意角度的环形字符分割算法进行分割处理,具体包括以下步骤:首先确定字符区域,用霍夫变换定位到中心圆,得到圆心与半径;由圆心向外,从半径的1.3倍处,按照半径的递增,对待处理的图像中的像素进行扫描,判断扫描到的一圈像素中,白色像素的比例是否大于10%且均匀分布,如果是,就记录下该半径值r1;接着增加半径,继续扫描,并继续判断扫描到的一圈像素中,白色像素的比例是否大于10%且均匀分布,如果否,就记录下当前的半径值r2。在待处理的主齿轮特殊打标形状的字符图像中,按照这两个半径值截取出一个圆环形的目标区域,该圆环形的目标区域就是包含有目标主齿轮特殊打标形状的字符的圆环形区域。

基于任意角度的环形字符分割算法。以定位到的圆心(a,b)为中心,建立一个坐标系,并设置计数器C=0,总偏移角度D=0;在圆环形字符图像中读取与X轴正方向重叠的像素点(x,y);判断其中是否有像素值等于255;如果有则C=0,没有则C=C+1;判断C是否大于等于20;如果不是则将坐标系顺时针旋转1度。继续读取与X轴正方向重叠的像素点(x1,y1)。并跳转到第3步;利用坐标旋转公式求取出当前要读取的像素点的坐标;如果C大于等于20,则当前总偏移角度D中的值,就是主齿轮特殊打标形式的字符图像,圆环形区域中的空白的位置。将D中的偏移角度作为下面将圆环形字符变换到矩形字符的起始位置;得到圆环形字符的起始位置以后将前面得到的起始位置设为割开圆环的位置,将圆环区域变换成矩形区域。

然后对矩形字符图像进行分割,具体步骤是:从起始位置开始,逐列扫描矩形区域的像素;如果出现白色像素,则认为出现了有效字符,并记录下横坐标的值x1;继续扫描,直到白色像素消失,即白色像素点占该列像素点数的百分比小于5%,记录下横坐标的值x2;利用x1与x2,分割字符,重复以上3步,直到扫描完整个矩形区域;在得到单一的字符以后,为了方便对单一字符提取特征,本文将单一字符归一到60*60大小。

最后对分割后的单独字符图像进行识别,使用SVM支持向量机算法进行识别,这个过程使用粒子群算法优化支持向量机算法的惩罚因子和核函数的参数,对主齿轮特殊打标形式字符进行识别。将细胞大小设置为6*6,块大小为12*12,每个块内有2*2个细胞,从图像的左上角开始,用块以6个像素为步长,遍历整幅图像,即得到9*9个块。求取图像X方向上的偏导数和Y方向上的偏导数,在求取出图像的梯度幅值矩阵和梯度方向矩阵。然后将梯度方向设为0-180度,并将其9等分,分为9个梯度方向。对每一个6*6细胞内的每一个像素点对该9个梯度方向进行投票,并用该方向上的梯度幅值进行加权,得到一个9维的特征向量。然后将一个块内的2*2个细胞的9维特征向量组合在一起,形成36维的特征向量,对其进行归一化。将单一字符图像中全部9*9个块的36维特征向量组合成2916维特征向量。对于一个单一的字符图像来说,该2916维特征向量就是其HOG特征向量,用来代表该字符。

在利用SVM算法对特殊打标形式的字符进行识别时,会遇到一些问题。比如,SVM的惩罚因子与核函数参数会对最终的识别效率产生很大的影响。粒子群算法是一种随机优化算法,可以进行全局寻优。在本发明实施例中,针对特殊打标形式的字符,采用粒子群算法对SVM的惩罚因子与核函数参数进行优化,其中利用k-fold交叉验证法计算误差作为粒子群算法的适应值,来对SVM的惩罚因子与核函数参数的优劣进行评价。最终得到最适合于本发明特殊打标形式的字符的惩罚因子和核函数参数。

在衡量SVM算法的推广能力时,采用k-fold交叉验证法来对SVM的参数进行优化筛选。具体将样本先分为大小大致相等的k个子集,总共进行k次训练和测试,每次进行训练和测试时,选取其中一个子集作为测试集,其余作为训练集。将每一次训练和测试所得到的错分类的个数总和与总样本的个数的比值作为错误率的估计。

本发明采用的粒子群算法优化惩罚因子C和核函数参数σ的具体步骤如下:读取训练集的字符样本数据,初始化粒子群,即用一组随机的C和σ值作为粒子的初始位置;针对每一个粒子,计算其适应值,并将初始的适应值作为每一个粒子个体的最优解,然后寻找全局最优解;用k-fold交叉验证误差作为适应值,记忆粒子个体与全局分别对应的最优解,计算得出粒子更新后的位置,然后继续计算其适应度,并将当前的适应度与其历史最优适应度进行比较,如果优于历史最优适应度,则用当前适应度,更新历史最优适应度,并将当前粒子的位置作为粒子的最优解;重复上述步骤,直到输出最优解。

如图3所示,是本发明的一种后桥主齿轮特殊打标形式的字符识别系统的结构示意图,该系统包括:预处理单元301,分割算法单元302,字符识别单元303。

预处理单元301,用于对获取的后桥主齿轮特殊打标形式的字符图像进行预处理,具体包括降噪处理单元,通过使用灰度化和高斯模糊算法,用于对采集到的后桥主齿轮特殊打标形式的字符图像进行降噪处理;边缘处理单元,通过使用Canny边缘检测算法和腐蚀膨胀算法,用于对图像进行边缘检测和去毛刺处理。

分割算法单元302,用于对预处理后的字符图像,使用基于任意角度的环形字符分割算法进行分割处理,具体包括:圆心定位单元,用于定位环形字符区域的圆心,并以该圆心为中心建立坐标系;区域定位单元,用于根据半径偏移,定位到环形字符区域,用坐标旋转公式求出环形字符区域像素点的坐标,并确定起始位置坐标;区域变换单元,用于从起始位置坐标开始,将环形字符区域变换成矩形字符区域;区域分割单元,用于从起始位置坐标开始,逐列扫描矩形字符区域的像素点,如果出现没有字符的像素列,则对其进行分割,直到对矩形字符区域扫描完成;

字符识别单元303,用于对分割后的单独字符图像进行识别,具体包括:特征提取单元,用于对分割后的单一字符图像提取字符HOG特征;参数计算单元,用于根据提取的HOG特征计算粒子群算法优化支持向量机的惩罚因子和核函数参数;识别单元,用于根据计算出的惩罚因子和核函数参数选取其最优解,对字符图像进行识别。

应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号