首页> 中国专利> 一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法及应用

一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法及应用

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法包括：1)提取光学刻划字符边缘点，构成所述边缘点的′十′字简化邻域；2)根据刻划字符特点对特征进行3阶量化，确定所述光学刻划字符图像的高亮度和背景亮度的划分阈值、低亮度和背景亮度的划分阈值；3)基于所述的划分阈值对提取的边缘点的′十′字简化邻域像素值进行3阶量化，并转换成特征向量；4)对量化后的边缘点的特征向量进行人为真、假标记，作为训练集；5)利用Adaboost分类方法训练训练集，得到分类函数。本发明相比一般的方法对字符边缘点的真假分类上更加准确，对于图像整体光照变化有更强的鲁棒性，并且特征更加简单，为后续字符的处理带来很大帮助。

著录项

公开/公告号CN107194435A

专利类型发明专利
公开/公告日2017-09-22

原文格式PDF
申请/专利权人山东建筑大学;
展开▼

申请/专利号CN201710465168.3
发明设计人韩晓;许鸿奎;
展开▼

申请日2017-06-19
分类号
代理机构济南金迪知识产权代理有限公司;
代理人吕利敏
地址 250000 山东省济南市历城区凤鸣路
入库时间 2023-06-19 03:19:06

法律信息

法律状态公告日

法律状态信息

法律状态
2020-07-31

授权

授权
2020-07-24

著录事项变更 IPC(主分类):G06K9/62 变更前: 变更后: 申请日:20170619

著录事项变更
2017-10-24

实质审查的生效 IPC(主分类):G06K9/62 申请日:20170619

实质审查的生效
2017-09-22

公开

公开

说明书

技术领域

本发明涉及一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法及应用，属于工业追踪产品信息的技术领域。

背景技术

光学刻划字符广泛应用于工业产品的标牌和铭牌上，用以追踪产品信息。通常由硬质合金打标针或镶嵌工业钻石的打标针直接刻入金属工件的材料内部而形成的标示，采用低角度前景光式照明方法采集图像。由于这是一种凹凸的立体字符，笔画中存在光线被遮挡的情况，表现为与光线平行方向的笔画呈现高灰度值，与光线垂直方向的笔画呈现低灰度值，背景的灰度值介于以上两种之间，如图1所示。因此常用的基于梯度的边缘提取方法无法准确地提取刻划字符的边缘，因为在笔画中的高灰度像素区域和低灰度像素区域的交界处，梯度也发生了大幅变化，基于梯度的边缘提取方法也会把这些点检测出来，而这些点不是字符边缘的有效组成部分，属于假边缘点。这些假边缘点的存在为后续的字符识别与检测造成了巨大障碍。

中国专利文献CN 105279507公开了一种提取刻划字符轮廓的方法，该发明是采用多相活动轮廓模型确定高低亮度区域，通过直方图分析将多相图像转换成双相图像最后利用水平集的方法获得轮廓。

中国专利文献CN 106023191公开了一种基于结构特征的光学刻划字符边缘提取和边缘拟合方法，其在canny算子提取的边缘基础上，通过模式识别方法(结合模板提取和K近邻方法)去除字符边缘中的假边缘点，得到断续的字符轮廓，然后根据笔画结构特征和断点距离和位置对边缘进行拟合。

上述专利文献都是对刻划字符进行轮廓提取的方法，而本发明的目的是针对专利文献CN 106023191中，去除假边缘的方法(结合模板提取和K近邻的方法)进行了改进。为了去除这些假边缘点，可以使用模式识别的方法，首先提取边缘点的特征，然后使用分类器对特征进行分类，从而达到去除假边缘点的目的。专利文献CN 106023191，采用基于邻域特征结合K近邻分类器的方法，但是该种特征提取方法存在特征繁杂冗余、对光照鲁棒性不强和K近邻的模板选取复杂等问题，而本方法通过对邻域特征进行简化，降低了特征的维度，从而减少了模式的数量，有利于样本的选择。通过结合直方图的方法对邻域特征进行了量化，使得该种特征对光照有较好的鲁棒性。通过分析发现该种分类问题属于样本不均衡问题，采用Adaboost分类方法比K近邻具有更好的分类效果。

发明内容

针对现有技术存在的技术问题，本发明提出一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法。

本发明还提出了一种利用上述方法去除样本光学刻划字符中的假边缘点的方法。

发明概述：

一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法，包括：

首先，使用Canny算子提取光学刻划字符边缘点，以所述边缘点为中心向上、向下、向左、向右分别提取一个字符笔画长度的像素灰度，构成所述边缘点的′十′字简化邻域；

其次，通过分析图像的灰度直方图，确定高亮度、低亮度和背景亮度的划分阈值；

继而，基于所述的划分阈值对提取的边缘点的′十′字简化邻域像素值进行3阶量化，并转换成特征向量；

最后，对量化后的边缘点的特征向量进行真、假标记，作为训练集；利用Adaboost分类方法训练训练集，得到分类函数，利用分类函数去除样本点中的假边缘点。

本发明的技术方案如下：

一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法，包括：

1)提取光学刻划字符边缘点，以所述边缘点为中心向上、向下、向左、向右分别提取单位字符笔画长度的像素灰度，构成所述边缘点的′十′字简化邻域；

2)根据刻划字符特点对特征进行3阶量化，确定所述光学刻划字符图像的高亮度和背景亮度的划分阈值、低亮度和背景亮度的划分阈值；

3)基于所述的划分阈值对提取的边缘点的′十′字简化邻域像素值进行3阶量化，并转换成特征向量；

4)对量化后的边缘点的特征向量进行人为真、假标记，作为训练集；

5)利用Adaboost分类方法训练训练集，得到分类函数。

根据本发明优选的，在步骤1)中，利用Canny算子提取光学刻划字符边缘点。

根据本发明优选的，在步骤1)中，以所述边缘点为中心向上、向下、向左、向右分别提取一个字符笔画长度的像素灰度。

根据本发明优选的，在步骤1)中，所述一个字符笔画长度为5个像素长度。即所述′十′字简化邻域的水平方向有11个像素灰度，垂直方向有11个像素灰度。

根据本发明优选的，在步骤2)中，通过分析光学刻划字符图像的灰度直方图，确定所述光学刻划字符图像的高亮度和背景亮度的划分阈值、低亮度和背景亮度的划分阈值。在步骤2)中，通过分析刻划字符图像特点，发现其由高亮度区域、低亮度区域和背景亮度区域组成，所以对特征选择3阶量化最为符合图像特点。

根据本发明优选的，在步骤2)中，通过分析光学刻划字符图像的灰度直方图，确定所述光学刻划字符图像的高亮度和背景亮度的划分阈值、低亮度和背景亮度的划分阈值的方法如下：

将所述低亮度和背景亮度的划分阈值，定为所述灰度直方图中最大连续单调上升的起始处；

将所述高亮度和背景亮度的划分阈值，定为所述灰度直方图中最大连续单调下降的结束处。

根据本发明优选的，所述划分阈值的具体方法为：

(1)所述光学刻划字符图像为256级的灰度图像表示为I(x，y)，所述光学刻划字符图像的灰度直方图为h(n)，n＝1，2…256，灰度直方图的梯度梯度符号g(n)＝sign(G(n))；

(2)梯度变号处标记为C_n＝g(n)*g(n+1)，当C_n＞0时，表示在n处梯度符号不变，当C_n＜0时，表示在n处梯度符号改变；C_n＜0记为

(3)计算连续上升和连续下降的长度A_i＝(a_i+1-a_i)*g(a_i)，当所述A_i为正时，表示是上升，当所述A_i为负时，表示是下降。

(4)计算max(A_i)时的A_i记为A_p，min(A_i)时的A_i记为A_q，最大连续上升起始处就是a_p，最大连续下降的结束处就是a_q+1；即a_p是低亮度和背景亮度的划分阈值，a_q+1是高亮度和背景亮度的划分阈值。

根据本发明优选的，所述步骤3)中转换成特征向量的方法：通过把垂直方向的像素经过转置后，添加于水平方向像素后，构成特征向量，即构成长度为22个像素的特征。

根据本发明优选的，所述步骤4)利用Adaboost分类方法训练训练集，得到分类函数的具体方法如下：

即，自适应增强算法Adaboost采用Gentle Adaboost模型，其训练过程描述如下：

4-1)训练样本共有N个，并且标记为：(x₁，y₁)，...，(x_N，y_N)，其中，x_i∈Rⁿ为待训练特征，y_i∈{-1，1}；y_i＝1表示为真边缘点，y_i＝-1表示为假边缘点；

4-2)初始化样本的权重：W_i＝1/N，i＝1，...N；

4-3)对j＝1，2…M，其中M表示训练的轮数；

a.从所有的待训练特征样本中，挑选第j轮中，最佳的弱分类器h_j(x)，使得在该样本权重的分布下，样本的加权均方误差最小，即，选择最小下的h_j(x)；

b.对权重进行更新：W_i←W_i·exp(-y_i·h_i(x_i))，i＝1，...N；

c.归一化权重使得：

4-4)输出强分类器：当x≥0，sign(x)为1，否则为-1。

一种利用上述方法去除样本光学刻划字符中的假边缘点的方法，为利用分类函数去除样本点中的假边缘点。即，通过训练集，训练得到分类器H(x)，把待分类点的特征(即简化邻域特征)输入，即可得到分类结果。

本发明的有益效果：

本发明相比一般的方法对字符边缘点的真假分类上更加准确，对于图像整体光照变化有更强的鲁棒性，并且特征更加简单，为后续字符的处理带来很大帮助。

本发明采用量化后的简化邻域特征，结合Adaboost进行分类：

1、通过对水平和垂直方向的像素进行采样，减少了特征维度，降低了样本选择的复杂度。

2、对特征进行了量化，并通过对直方图分析，确定量化阈值，使得本特征对光照的鲁棒性增强。

3、由于真假边缘点样本数量的不均，该问题是一种样本不均衡问题，采用Adaboost分类方法比K近邻方法更好。

附图说明

图1为原始光学刻划字符图像；

图2为本发明提取的边缘点结果；

图3为本发明中所述′十′字简化邻域示意图；

图4为光学刻划字符图像的灰度直方图；

图5-1为量化后的水平方向的结果；

图5-2为量化后的垂直方向的结果；

图6为使用分类器去除的假边缘点；

图7为去除假边缘点以后的结果；

图8是邻域特征K近邻分类结果图；

图9是简化邻域特征K近邻分类结果图；

图10邻域特征在Adaboost下分类结果；

图11简化邻域特征在Adaboost下分类结果；

图12是K近邻分类器下两种特征对真点分类错误率统计结果；

图13是K近邻分类器下两种特征对假点分类错误率统计结果；

图14是Adaboost分类器下两种特征对真点分类错误率统计结果；

图15是Adaboost分类器下两种特征对假点分类错误率统计结果。

具体实施方式

下面结合附图与实施例对本发明作进一步说明，但不限于此。

实施例1、

一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法，包括：

1)利用Canny算子提取光学刻划字符边缘点，以所述边缘点为中心向上、向下、向左、向右分别提取一个字符笔画长度的像素灰度，构成所述边缘点的′十′字简化邻域；所述一个字符笔画长度为5个像素长度。即所述′十′字简化邻域的水平方向有11个像素灰度，垂直方向有11个像素灰度。

特征的选择对分类效果有至关重要的作用，既要考虑特征的准确性，还要考虑特征的鲁棒性和简易性。通过分析canny算子提取的边缘点周围像素灰度发现，真，假边缘点的邻域灰度分布有明显不同，真边缘点总位于，高灰度与背景灰度之间，或者低灰度与背景灰度之间，假边缘点总是位于高、低灰度的交界处，而且假边缘点的走向通常为水平方向、垂直方向和对角方向。虽然邻域灰度包含了该点的真假信息，但同时也有许多信息的冗余，而且邻域的长度也不能选择太大，否则随着邻域半径的增大会急剧增加特征的维度，并且加剧分类上的困难，经过以上分析发现，水平与垂直方向的灰度值也能够包含大部分边缘点的真假信息，并且简化了特征的维度。为此选择边缘点的上、下、左、右，各一个笔画长度的像素作为特征，如图3所示，为叙述方便，称为′十′字简化邻域。

2)根据刻划字符特点对特征进行3阶量化，确定所述光学刻划字符图像的高亮度和背景亮度的划分阈值、低亮度和背景亮度的划分阈值；通过分析刻划字符图像特点，发现其由高亮度区域、低亮度区域和背景亮度区域组成，所以对特征选择3阶量化最为符合图像特点。

通过分析光学刻划字符图像的灰度直方图，确定所述光学刻划字符图像的高亮度和背景亮度的划分阈值、低亮度和背景亮度的划分阈值；

将所述低亮度和背景亮度的划分阈值，定为所述灰度直方图中最大连续单调上升的起始处；

将所述高亮度和背景亮度的划分阈值，定为所述灰度直方图中最大连续单调下降的结束处。

为了进一步简化特征，对′十′字邻域的像素进行量化，结合刻画字符特点，考虑到刻画字符有低灰度区域、高灰度区域和背景灰度区域，所以量化阶数选择3最为合适。由于每个字符和光源的距离不一样，金属表面也不是绝对的平整，导致字符图像灰度有略微的变化，根据经验直接选择阈值进行量化，不能完全适用于所有字符，使得结果出现偏差。因而，对每个字符图像的灰度直方图进行分析，如图4所示，发现字符图像中背景区域像素占总像素的大部分，并在直方图中近似服从正态分布，高低像素位于直方图两侧区域，鉴于这个特点，把低阈值设定为直方图中最大连续单调上升的起始处，高阈值设定为直方图中最大连续单调下降的结束处，从而达到自适应的效果。

所述划分阈值的具体方法为：

(2)梯度变号处标记为C_n＝g(n)*g(n+1)，当C_n＞0时，表示在n处梯度符号不变，当C_n＜0时，表示在n处梯度符号改变；C_n＜0记为

(3)计算连续上升和连续下降的长度A_i＝(a_i+1-a_i)*g(a_i)，当所述A_i为正时，表示是上升，当所述A_i为负时，表示是下降。

3)基于所述的划分阈值对提取的边缘点的′十′字简化邻域像素值进行3阶量化，并转换成特征向量；通过把垂直方向的像素经过转置后，添加于水平方向像素后，构成特征向量，即构成长度为22个像素的特征向量。

4)对量化后的边缘点的特征向量进行人为真、假标记，作为训练集；

5)利用Adaboost分类方法训练训练集，得到分类函数。

实施例2、

如实施例1所述的一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法，其区别在于，所述步骤4)利用Adaboost分类方法训练训练集，得到分类函数的具体方法如下：

即，自适应增强算法Adaboost采用Gentle Adaboost模型，其训练过程描述如下：

4-2)初始化样本的权重：W_i＝1/N，i＝1，...N；

4-3)for j＝1：M，其中M表示训练的轮数；

a.从所有的待训练特征样本中，挑选第j轮中，最佳的弱分类器h_j(x)，使得在该样本权重的分布下，样本的加权均方误差最小，即，选择下的h_j(x)；

b.对权重进行更新：W_i←W_i·exp(-y_i·h_i(x_i))，i＝1，...N；

c.归一化权重使得：

4-4)输出强分类器：当x≥0，sign(x)为1，否则为-1。

为了采用分类器进行真假分类，首先需要对量化后的特征向量进行真、假标记，用来作为训练集。但是由于刻划字符样本中存在样本不平衡问题，真边缘点的数量远远大于假边缘点的数量，所以在训练样本的采集时，需要进行筛选，减少不平衡性。

分类器选择上，传统的K近邻算法在面对样本不平衡问题时，往往不能获得很好的效果，为了进一步减少样本不平衡对分类结果的影响，选择使用GentleAdaboost分类算法作为分类器，Gentle Adaboost算法通过将多个弱分类器，经过优化算法加权组合成强分类器，由于对分类错误的样本权值会加大，所以对于难以分类的样本能够表现很好的效果。

实施例3、

一种利用如实施例1、2所述方法去除样本光学刻划字符中的假边缘点的方法，为利用分类函数去除样本点中的假边缘点。

把后续待分类样本经过提取简化′十′字邻域特征向量，经过量化并转换成特征向量后，输入分类器H(x)，输出的结果就是分类的结果。图6所示就是分类后去除的假边缘点，图7所示是去除假边缘后的边缘。

对比例、

将本发明所述方法与现有技术(结合K近邻方法对真假边缘点进行分类)的方法相比较。

现有技术：采用5×5邻域特征，结合K近邻方法对真假边缘点进行分类。

邻域特征用K近邻算法分类，在图像灰度整体改变的时候测试结果，以字符′G′为例，在灰度改变不大的时候邻域特征表现出较好的分类效果，但是在图像整体灰度值发生变化的时候基于邻域特征的识别率急剧下降，出现许多的错误，如图8所示。

邻域特征在图像灰度发生改变的时候，分类效果下降，而简化邻域特征由于根据直方图进行了量化，在面对图像整体灰度改变时，仍能够有较好的区分效果，表现出很好的稳定性，如图9。

Adaboost算法结果，由于K近邻算法对于不均衡样本存在样本选取困难等问题，采用Gentle Adaboost分类方法对邻域特征，以及简化邻域特征在模拟光照强度变化下进行比较。

邻域特征结合Adaboost的分类结果，如图10，简化特征结合Adaboost的分类结果，如图11。

对分类结果的错误率进行统计，数值越高表示分类效果越差。图12是K近邻分类器下两种特征对真点分类错误率统计结果；图13是K近邻分类器下两种特征对假点分类错误率统计结果；图14是Adaboost分类器下两种特征对真点分类错误率统计结果；图15是Adaboost分类器下两种特征对假点分类错误率统计结果。

结论

根据整体灰度值的变化统计了两种特征对于真假边缘点的分类错误率。如图14、图15，横坐标表示图像整体的灰度改变模拟光照的改变，由低到高，纵坐标表示分类错误率，数值越高表示分类效果越差。分别计算对假边缘点和真边缘点的分类误差。从实验结果上看，Adaboost算法对于占少数样本的假边缘点，相比K近邻算法具有更加高的识别率。而对于占多数样本的真边缘点，识别率有所下降。基于邻域灰度的特征在图像灰度不改变时拥有最高的识别效率，但是当灰度改变时分类错误率急剧上升。而发明所述方法基于简化邻域的特征，无论灰度如何改变，都能保持较好的分类效果。通过以上两种特征在K近邻算法和Adaboost下比较，本发明提出的基于简化邻域的特征，通过自适应改变量化阈值，使得在光照发生改变时，仍然获得很好的识别效率，对光照改变具有较强的鲁棒性。通过比较分类器，发现Adaboost算法在对假边缘点的分类上效果更好，但同时对于真边缘点的识别率也略有降低，由于对于假边缘点的去除相对更为重要，所以就去除假边缘点的问题，使用Adaboost算法更好。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法及应用 [P] . 中国专利： CN107194435B . 2020.07.31
2. 一种基于简化邻域的光学刻划字符边缘点真假的特征表示和分类方法及应用 [P] . 中国专利： CN107194435A . 2017-09-22
3. Method and system for text classification based on learning of transferable feature representations from a source domain [P] . 美国专利： US10832166B2 . 2020-11-10

机译：基于从源域学习可转移特征表示的文本分类方法和系统
4. METHOD AND SYSTEM FOR TEXT CLASSIFICATION BASED ON LEARNING OF TRANSFERABLE FEATURE REPRESENTATIONS FROM A SOURCE DOMAIN [P] . 美国专利： US2018174071A1 . 2018-06-21

机译：基于来自源域的可传递特征表示的文本分类方法和系统
5. OCR:Optical Character Recognition .Processing methods and systems that allow the seller subscriber to automatically access a recognized phone number or a dedicated homepage by name using an optical character recognition application from a mobile phone or mobile phone and process the results automatically into the seller's subscriber's Point of Sales System [P] . 韩国专利： KR20200118339A . 2020-10-15

机译： OCR：光学字符识别。该处理方法和系统允许卖方订户使用来自手机或手机的光学字符识别应用程序按名称自动访问识别的电话号码或专用主页的名称，并将结果自动处理到卖方订户的销售点系统