法律状态公告日
法律状态信息
法律状态
2017-01-11
未缴年费专利权终止 IPC(主分类):G06K9/62 授权公告日:20150708 终止日期:20151129 申请日:20121129
专利权的终止
2015-07-08
授权
授权
2013-05-08
实质审查的生效 IPC(主分类):G06K9/62 申请日:20121129
实质审查的生效
2013-04-10
公开
公开
技术领域
本发明涉及一种图像的分类方法,特别是一种针对小样本以及高维图像的分类方法。
背景技术
图像分类方法是根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读。图像分类方法经过多年的发展,已经被应用到各个领域当中,例如地理信息分类、钢铁表面缺陷识别、织物表面缺陷识别、木材表面缺陷识别、农产品分类识别等领域,但在工业图像分类领域,例如带钢表面缺陷图像识别,已有的方法却存在如下缺陷:(1)针对高维图像分类效果不理想;(2)训练样本相对于待分类图像为小样本时分类率不高;(3)输入参量复杂,不同的参数严重影响识别效果,同时引起调试和维护的困难。因此,有效提高图像分类的效果,这将产生十分积极的市场效应和巨大的应用价值。
发明内容
为了解决现有技术的不足,本发明提供了一种输入参量少,针对小样本以及高维图像的分类方法。
本发明解决其技术问题所采用的技术方案是:
一种针对小样本以及高维图像的分类方法,包括以下步骤:
(1)获得第一分类规则:选取图像作为训练集,对训练集进行图像特征提取处理,图像特征包括形状特征、颜色特征、位置特征和质心特征,然后使处理后的训练集进入一级分类器,得出第一分类规则,所述一级分类器采用特征描述方法来设计,第一分类规则采用专家经验决策对图像类型的理解,通过特征描述决策来表达图像类型;
(2)对图像一级分类:选取图像作为测试集,对测试集进行图像特征提取处理,图像特征包括形状特征、颜色特征、位置特征和质心特征,然后将处理后的测试集通过第一分类规则,得出可分类图像和不可分类图像两种类型图像;
(3)获得第二分类规则:对训练集进行图像归一化处理,然后采用流形降维方法ISOMAP进行图像降维,根据ISOMAP算法的抗噪声、处理稀疏数据和参数敏感度低的特性,将处理后的训练集降维至30维以下的特征向量,使处理后的训练集进入二级分类器,所述二级分类器为支持向量机分类器,将训练集产生的特征向量输入支持向量机中进行分类,获得第二分类规则;
(4)对图像二级分类:对不可分类图像进行图像降维以及图像归一化,然后使处理后的不可分类图像通过第二分类规则,获得每幅图像类型。
(5)获得第三分类规则:对训练集进行图像特征提取,图像特征 包括位置特征和质心特征,然后使处理后的训练集进入三级分类器,将位置特征和质心特征输入至三级分类器内的决策树算法进行学习,获得树状拓扑结构的句法分类规则,即为第三分类规则;
(6)对图像三级分类,得出分类结果:将步骤(2)中的可分类图像和经步骤(3)处理后的不可分类图像通过第三分类规则,得出分类结果。
作为上述方案的优选方案,所述图像归一化处理采用的图像像素为50×50~300×300,图像归一化后的维度为2500维~90000维。
所述一级分类器与二级分类器之间采用双数据流方式衔接,二级分类器与三级分类器之间的图像传输采用标记方式进行传输,只输出图像的图号和类型号,降低数据处理时间。
所述质心特征主要有横向质心特征和纵向质心特征,质心特征的主要属性包括有:横向或纵向盒偏移、横向或纵向盒偏移比率、亮度横向或纵向偏移、亮度横向或纵向偏移比率和亮度横向或纵向盒偏移比率;其中边界盒(box)是指可完全包围图像中所有阈值限定像素的最小矩形。
横向或纵向盒偏移即图像横向或纵向质心到图像的边界盒横向或纵向中心的距离。
横向或纵向盒偏移比率用于度量独立于图像尺寸的横向或纵向盒偏移,该值的范围为 -1.0 到 +1.0。
亮度横向或纵向偏移即是图像的亮像素的横向或纵向质心到所 有图像像素的横向或纵向质心的距离。
亮度横向或纵向偏移比率,此比率用于度量独立于图像尺寸的亮度横向或纵向偏移。此值的范围为 -1.0 到 +1.0。
亮度横向或纵向盒偏移比率,此比率用于度量独立于图像尺寸的亮度横向或纵向盒偏移。此值的范围为 -1.0 到 +1.0。
其中:亮度横向或纵向盒偏移比率=亮度横向或纵向盒偏移/(边界盒宽度/2)。
本发明相比于现有技术具有的有益效果是:
(1)结合工业生产的特点,该方法中的一级图像分类具有较强的人工可控性。
(2)结合了流形降维方法与支持向量机的优势,本方法适合于高维、小样本图像的分类。
(3)组合图像类型直接表达方法、流形降维方法与支持向量机分类方法以及基于位置特征和质心特征的树状拓扑结构分类方法,建立了三级图像分类方法。
(4)三级图像分类器之间数据传输量少,不影响效率。
(5)该方法操作简单,算法衔接良好,输入参量少,便于使用和维护,值得在工业生产中推广,在工业生产领域具有重大科研价值与应用价值。
附图说明
图1是本发明的方法流程图;
图2是图像位置特征的示意图;
图3是图像质心特征的示意图;
图4是带钢表面缺陷训练集的图像像素示意图;
图5是本发明实施例的第三分类规则示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
一种针对小样本以及高维图像的分类方法,参照图1,包括以下步骤:
(1)获得第一分类规则:选取图像作为训练集,对训练集进行图像特征提取处理,图像特征包括形状特征、颜色特征、位置特征和质心特征,然后使处理后的训练集进入一级分类器,得出第一分类规则,所述一级分类器采用特征描述方法来设计,第一分类规则采用专家经验决策对图像类型的理解,通过特征描述决策来表达图像类型,由于许多缺陷是加工工序所造成的,形成原因较为固定,或者在形成该缺陷的设备中也有相应的输出控制,并且许多缺陷有固定的形状特征、颜色特征、位置特征和质心特征,所以容易根据专家经验通过简单的决策来识别;
(2)对图像一级分类:选取图像作为测试集,对测试集进行图像特征提取处理,图像特征包括形状特征、颜色特征、位置特征和质心特征,然后将处理后的测试集通过第一分类规则,得出可分类图像和不可分类图像两种类型图像;
(3)获得第二分类规则:对训练集进行图像归一化处理,然后采 用流形降维方法ISOMAP进行图像降维,根据ISOMAP算法的抗噪声、处理稀疏数据和参数敏感度低的特性,将处理后的训练集降维至30维以下的特征向量,使处理后的训练集进入二级分类器,所述二级分类器为支持向量机分类器,将训练集产生的特征向量输入支持向量机中进行分类,获得第二分类规则;
(4)对图像二级分类:对不可分类图像进行图像降维以及图像归一化,然后使处理后的不可分类图像通过第二分类规则,获得每幅图像类型;
(5)获得第三分类规则:对训练集进行图像特征提取,图像特征包括位置特征和质心特征,然后使处理后的训练集进入三级分类器,将位置特征和质心特征输入至三级分类器内的决策树算法进行学习,获得树状拓扑结构的句法分类规则,即为第三分类规则;
(6)对图像三级分类,得出分类结果:将步骤(2)中的可分类图像和经步骤(3)处理后的不可分类图像通过第三分类规则,得出分类结果。
作为本发明的优选方案,所述图像归一化处理采用的图像像素为50×50~300×300,图像归一化后的维度为2500维~90000维。所述一级分类器与二级分类器之间采用双数据流方式衔接,二级分类器与三级分类器之间的图像传输采用标记方式进行传输,只输出图像的图号和类型号,降低数据处理时间。
本发明中采用的形状特征主要有:宽度、高度、长宽比率、图像面积、图像周长、密度、周长比率 圆整等特征。另外还有:阈值限定像素(Threshold pixels),是指超过图像与背景一定灰度值的像素点,用阈值来度量超过的值的大小。采用的颜色特征主要有:颜色直方图(Color histogram),颜色相关图(Color Correlogram),颜色矩(Color moment),颜色一致性矢量(CCV: color coherence vectors)等;其中位置特征反映的是图像部分与整体背景之间的直接关系,同时也可以用于度量很多工业生产中有着特殊定性的图像,其主要包括:图像距背景左侧距离、图像距背景右侧距离、图像距背景顶部距离,图像中心距背景左侧距离等,其直观表述方式如图2所示;质心特征描述了基于图像质心的属性,质心是图像的质量中心,有时也称为重心或平衡点,其主要为:横向或纵向质心、横向或纵向盒偏移、横向或纵向盒偏移比率、亮度横向或纵向偏移、亮度横向或纵向偏移比率和亮度横向或纵向盒偏移比率,质心的直方图如图3所示,质心特征的属性如下:
其中边界盒(box)是指可完全包围图像中所有阈值限定像素的最小矩形。
横向或纵向盒偏移即图像横向或纵向质心到图像的边界盒横向或纵向中心的距离。如果图像像素大部分在盒中心的左侧(上方),则此距离为负;如果图像像素大部分在盒中心的右侧(下方),则此距离为正。
横向或纵向盒偏移比率用于度量独立于图像尺寸的横向或纵向 盒偏移,该值的范围为 -1.0 到 +1.0。如果图像像素大部分在盒中心的左侧(上方),则此值为负;如果图像像素大部分在盒中心的右侧(下方),则此值为正。如果值为 0.5 ,表示图像像素平均位于盒中心右侧(下方),距离等于图像边界盒宽度的四分之一。
亮度横向或纵向偏移即是图像的亮像素的横向或纵向质心到所有图像像素的横向或纵向质心的距离。如果亮像素大部分在全部图像像素的左侧(上方),则此距离为负;如果亮像素大部分在全部图像像素的右侧(下方),则此距离为正。
亮度横向或纵向偏移比率,此比率用于度量独立于图像尺寸的亮度横向或纵向偏移。此值的范围为 -1.0 到 +1.0。如果亮像素大部分在全部图像像素的左侧(上方),则此值为负;如果亮像素大部分在全部图像像素的右侧(下方),则此值为正。值为 0.5 表示亮像素(平均)位于全部图像像素的右侧(下方),距离等于图像的边界盒宽度的一半。
亮度横向或纵向盒偏移比率,此比率用于度量独立于图像尺寸的亮度横向或纵向盒偏移。此值的范围为 -1.0 到 +1.0。如果亮像素大部分在盒中心的左侧(上方),则此值为负;如果亮像素大部分在盒中心的右侧(下方),则此值为正。值为 0.5 表示亮像素(平均)位于盒中心右侧(下方),距离等于图像边界盒宽度的四分之一。
根据以上可以得出:亮度横向或纵向盒偏移比率=亮度横向或纵向盒偏移/(边界盒宽度/2)。
在本实施例中,针对带钢缺陷图像分类,包括以下步骤:
(1)获得第一分类规则:选取500幅包含所有带钢缺陷的图像作为训练集,定义为φ500。对训练集进行图像特征提取处理,图像特征包括形状特征和颜色特征,然后使处理后的训练集进入一级分类器,得出第一分类规则,所述一级分类器采用特征描述方法来设计,第一分类规则采用专家经验决策对图像类型的理解,通过特征描述决策来表达图像类型,由于许多缺陷是加工工序所造成的,形成原因较为固定,或者在形成该缺陷的设备中也有相应的输出控制,并且许多缺陷有固定的形状特征、颜色特征、位置特征和质心特征,所以容易根据专家经验通过简单的决策来识别;通过专家经验设定决策,分类能够定义的缺陷图像:如定位孔洞,挖边缺陷等等10余种缺陷,无法分类的定义为未分类缺陷。其中定位孔洞描述为:
定位孔洞={“90mm2<圆整<101 mm2” and“120<密度”};
第一分类规则为定位孔洞,挖边缺陷等等10余种缺陷的人工描述符的组合:
If { “90mm2<圆整<101 mm2” and“120<密度”}
缺陷类型=定位孔洞
Elseif{“5<长宽比率”and“120<密度”and“亮度横向或纵向偏移<50”not “60<密度”};
缺陷类型=挖边缺陷
Elseif {“……”};
缺陷类型=小水滴
Elseif {“……”};
缺陷类型=光照缺陷
……
(2)对图像一级分类:选取带钢缺陷图像不同于训练集φ500的未知类型的带钢表面缺陷10组作为测试集,记为φt。将φt进行图像特征提取处理,图像特征包括形状特征、颜色特征、位置特征和质心特征。然后将处理后的测试集φt通过第一分类规则,满足第一规则中任何缺陷描述的图像被认为是可分类图像,并将第一规则分类获得的缺陷图像图号记录至矩阵LABLE_L1,相应缺陷类型记录至矩阵NAME_L1,不满足第一规则中的任何缺陷图像被定义为不可分类图像,将图序号记录至LABLE_UNCLASSIFICTION。可分类图像里面包括人工专家定义的各种缺陷类型,如定位孔洞,挖边缺陷等等10余中缺陷;
(3)获得第二分类规则,统计缺陷图像的大小,对训练集φ500进行图像归一化处理,如图4 所示,带钢表面缺陷训练集的图像归一化大小取均值232×143。然后采用流形降维方法ISOMAP进行图像降维,统计其参量嵌入领域(embedding neighbor)K 和标记值(Landmark)L在训练集φ500下的最佳数值,以获得最佳分类效果,本例计算获得参数K=30 and L=50。根据ISOMAP算法的抗噪声、处理稀疏数据和 参数敏感度低的特性,将处理后的训练集降维至30维以下的特征向量,根据残余方差值(residual variance)选择变化较幅度变小时的节点为最终降维维度d,获得最终降维后的训练集φd 。采用回归神经网络拟合训练集φ500与φd 获得其映射关系M500-d。将处理后的训练集φd进入二级分类器,所述二级分类器为支持向量机分类器,将训练集产生的特征向量输入支持向量机中进行分类,获得第二分类规则;
(4)对图像二级分类:选择不可分类的图像,即将测试集φt中图号为LABLE_UNCLASSIFICTION的取出,记为φ(t-u)。按照φ500中图像归一化大小(232,143)对φ(t-u)进行归一化,然后使用映射关系M500-d进行φ(t-u)降维至维度d,记为φtd,然后将φtd通过第二分类规则,获得每幅图像类型,图像类型名称由人工根据其实质类型,例如水渍、孔洞、结疤重皮等。
(5)获得第三分类规则:对训练集φ500进行图像特征提取,图像特征包括位置特征和质心特征,建立由决策树C4.5算法组成的三级分类器,然后将各个图像位置特征和质心特征输入至三级分类器内的决策树算法进行学习。第二分类规则获得的φ(t-u)分类结果作为类别监督,以增加学习过程第一分类规则和第二分类规则获得结果的类间距离。对训练集φ500的最终结果命名为第一和第二分类规则所获得的类型的进一步细分,细分方式由人工按照工业生产需求而定, 本例中缺陷细分名称为“缺陷类型”+(形成原因),例如水渍类型进一步细分为水渍(故障)和水渍(喷溅)。通过C4.5算法获得树状拓扑结构的句法分类规则,即为第三分类规则,第三分类规则如图5;
(6)对图像三级分类:将步骤(2)中的可分类图像和经步骤(3)处理后的不可分类图像通过第三分类规则,得出分类结果。Φt经三级分类,其结果包含了第一级第二级规则获得缺陷图像的类别,以及三级规则给定包含缺陷形成原因组成的最终缺陷类别名称。
在实际应用当中,新出现的缺陷图像通过了各类特种提取与大小归一化后,输入到上述规则当中,如果该缺陷类型为水渍,则在第一步中定义为已分类图像直接输入至第三步的规则中,并最终按照人工需要分类为水渍(故障)或水渍(喷溅)。
机译: 一种用于使用高维图像的低维图像的计算机实现的方法,一种用于训练人工神经网络的方法,用于在低维图像中找到地标,计算机程序和用于使用高维图像注册低维图像的地标
机译: 全景放射线图像,一种具有针对操作员和患者的简化设计的放射线图像,以及一种选择性地获得由体积层析成像的体锥束的装置
机译: 医学图像计算机断层扫描图像,一种在手术期间使用的生成方法,涉及基于重建体积生成体积图像数据集,并针对图像数据集的截面平面生成医学图像