首页> 中国专利> 一种反馈式ICM神经网络和FPF相结合的剪影识别系统

一种反馈式ICM神经网络和FPF相结合的剪影识别系统

摘要

一种反馈式ICM神经网络和FPF相结合的剪影识别系统,利用ICMNN具有的脉冲耦合特性,提取目标图像的完整轮廓;而所采用的反馈机制则对原始图像不断进行增强,从而达到抑制非同类目标同时增强同类目标的目的;随着不断迭代,FPF在经ICM处理过的图像中,不断搜索和目标边缘相似的候选目标,当找到可靠的同类目标时就会在相应位置产生较大的相关峰,而由于反馈机制的加入有效抑制其他非目标区域,从而使得其他区域的相关值降低,从而实现目标的可靠识别。本发明系统对于图中同类别的图像能够较好地识别,对具有一定旋转以及尺度变化的图像也具有较好的稳定性。与其他剪影识别算法相比计算量有所减小,工作量相应的降低,速度得到了增加。

著录项

  • 公开/公告号CN107330447A

    专利类型发明专利

  • 公开/公告日2017-11-07

    原文格式PDF

  • 申请/专利权人 三峡大学;

    申请/专利号CN201710414874.5

  • 申请日2017-06-05

  • 分类号

  • 代理机构宜昌市三峡专利事务所;

  • 代理人吴思高

  • 地址 443002 湖北省宜昌市大学路8号

  • 入库时间 2023-06-19 03:42:57

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-04-24

    授权

    授权

  • 2017-12-01

    实质审查的生效 IPC(主分类):G06K9/62 申请日:20170605

    实质审查的生效

  • 2017-11-07

    公开

    公开

说明书

技术领域

本发明一种反馈式ICM神经网络和FPF相结合的剪影识别系统,涉及图像识别技术领域。

背景技术

剪影识别是一种基于目标轮廓的图像识别技术,被广泛应用于机器人抓取,医学图像处理和基于内容的图像检索等领域。多年以来,出现了很多剪影识别算法,经典的有如下几种算法:1)基于统计学习的方法,基于统计学习的方法一般分成学习阶段(用于训练分类器)和分类阶段。学习阶段是在不同类别模式下的特征域内,评估每类目标边缘的分布;分类阶段是利用评估阶段得到的目标边缘分布对剪影图像进行分类。该类方法依赖于大量的统计特征,且容易出现过学习或过训练的现象。2)神经网络的方法,基于传统神经网络的方法,在学习阶段从不同类别的目标图像中提取一系列的特征参数,在分类阶段把提取的特征反馈给神经网络对图像进行分类,该方法需要对大量的测试图像进行学习才能进行相关的图像处理步骤。3)基于动态规划的方法,动态规划法是把未知目标边缘的图像和原目标图像作为一系列变量,然后计算两个变量之间的最短距离。该类方法若不事先采用穷举法计算出连接权值,就无法使用动态规划中常用的从后向前逐步递推的方法,因此计算量很大。

发明内容

针对以上几种经典剪影识别算法的不足,本发明提出了一种反馈式ICM神经网络和FPF相结合的剪影识别系统,该系统对于图中同类别的图像能够较好地识别,对具有一定旋转以及尺度变化的图像也具有较好的稳定性。与其他剪影识别算法相比计算量有所减小,工作量相应的降低,速度得到了增加。

本发明采取的技术方案为:

一种反馈式ICM神经网络和FPF相结合的剪影识别系统,利用ICMNN具有的脉冲耦合特性,提取目标图像的完整轮廓;而所采用的反馈机制则对原始图像不断进行增强,从而达到抑制非同类目标同时增强同类目标的目的;随着不断迭代,FPF在经ICM处理过的图像中,不断搜索和目标边缘相似的候选目标,当找到可靠的同类目标时就会在相应位置产生较大的相关峰,而由于反馈机制的加入有效抑制其他非目标区域,从而使得其他区域的相关值降低,从而实现目标的可靠识别。

一种反馈式ICM神经网络和FPF相结合的剪影识别系统,

步骤一:建立交叉视觉皮质模型ICM:

交叉视觉皮质模型ICM所构成的最小系统用以下三个式子来描述:

Fij[n+1]=fFij[n]+Sij+W{Y[n]}ij(l)

θij[n+1]=gθij[n]+hYij[n+1](3)

其中,输入矩阵为S,神经元的状态矩阵为F,输出矩阵为Y,动态阈值矩阵为θ,标量f和g小于1.0,令g<f,可确保阈值最终低于神经元的状态值,促使神经元激发,标量h是一个很大的值,当神经元激发时,使得阈值急剧增加,从而抑制神经元的脉冲发放,使其进入不应期,即在一定时期内不再发放脉冲;

步骤二:用交叉视觉皮质模型ICM对剪影图像处理,可产生一个包含目标轮廓的脉冲图像,FPF的作用是在该脉冲图像区域进行搜索,如果有与目标边缘相似的候选目标,则会在其相关面内产生相关峰值,FPF是等相关峰综合鉴别函数滤波器SDF和最小平均相关能量滤波器MACE的扩展;

SDF的基本思想是:将某类图像及其畸变图像组成一个训练集,找出综合鉴别函数,综合鉴别函数的目的是寻求这样一个滤波函数:当正确目标输入时,相关面内有一相关峰值;选出一组训练图像vi,令滤波器为h,SDF是输入加权线性组合,式(6)中矩阵V是通过输入向量的傅立叶变换的组合来创建的,

是V的傅立叶变换。每一个向量都和限制值Ci相关联,因此SDF滤波器h是通过下式来约束的,

如式(8)用的逆矩阵去找到h,

平均最小相关能量滤波器MACE是在综合鉴别函数的基础上发展而来的,利用MACE能够使训练图像相关运算后的平均相关能量最小化;

MACE滤波器是通过下式计算得到:

其中:

是第K个训练图像的第i个元素,二维分数幂指数滤波器可按如下公式描述:

其中

X由训练图像创建,与公式(6)相似,的元素由图像内部产生,是Y+k的共轭,

在公式(14)中,若幂项P=2则称之为最小平均相关能量滤波器,P=0式称之为鉴别函数滤波器,P处于0-2之间时称为分数幂指数滤波器FPF。

步骤三:利用反馈式ICM对结果图像再进行处理,最后得到只有目标图像存在的图像。基于此,利用反馈式ICM结合FPF形成一个闭环系统实现剪影识别。

本发明一种反馈式ICM神经网络和FPF相结合的剪影识别系统,有益效果如下:

(1)该系统对于图中同类别的图像能够较好地识别,对具有一定旋转以及尺度变化的图像也具有较好的稳定性。

(2)与其他剪影识别算法相比计算量有所减小,工作量相应的降低,速度得到了增加。

附图说明

图1是曲率流图像一;

图2是曲率流图像二;

图3是曲率流图像三;

图4是曲率流图像四。

图5是ICM模型框图。

图6是旋转10°角度下的FPF训练图像图;

图7是旋转20°角度下的FPF训练图像图;

图8是旋转30°角度下的FPF训练图像图;

图9是分数幂指数滤波器幂项P取0.1的结果图。

图10是分数幂指数滤波器幂项P取0.5的结果图。

图11是分数幂指数滤波器幂项P取0.9的结果图。

图12是FPF结合ICM的系统框图。

具体实施方式

由于非刚性目标形状变化多样,故要求识别算法不仅能有效地表示目标轮廓,同时还需在泛化与鉴别之间做好平衡。本发明将具有生物视觉神经系统的交叉视觉皮层模型神经网络(ICMNN)与分数幂指数滤波器(FPF)相结合,设计了一种利用反馈式ICMNN分离目标轮廓,并使用FPF实现快速相关的剪影识别系统。

一种反馈式ICM神经网络和FPF相结合的剪影识别系统,利用ICMNN具有的脉冲耦合特性,提取目标图像的完整轮廓;而所采用的反馈机制则对原始图像不断进行增强,从而达到抑制非同类目标同时增强同类目标的目的;随着不断迭代,FPF在经ICM处理过的图像中,不断搜索和目标边缘相似的候选目标,当找到可靠的同类目标时就会在相应位置产生较大的相关峰,而由于反馈机制的加入有效抑制其他非目标区域,从而使得其他区域的相关值降低,从而实现目标的可靠识别。

本发明一种反馈式ICM神经网络和FPF相结合的剪影识别系统,包括:

1:交叉视觉皮质模型(ICM)和反馈式视觉皮质模型(FICM):

1)、交叉视觉皮质模型:

交叉视觉皮质模型(ICM)主要是基于Eckhorn模型和Rybak模型演化而来,它是多种脑皮质模型交叉综合的产物,是一种简化的脉冲耦合神经网络模型。ICM比传统的人工神经网络模型更接近真实的生物视觉神经网络,且ICM计算量更少;另外,ICM还可利用基于曲率流理论实现的向心波技术克服脉冲耦合网络中存在的自动波干扰问题。利用这种技术,可使脉冲耦合神经网络中的自动波不再向外传播而是向目标中心传播,最后收缩为一点,如图1-4中各个目标图像的波形传递所示。这可用于减少因目标尺度变化所引起的轮廓大小变化对剪影识别所造成的影响。

ICM所构成的最小系统用以下三个式子来描述,图5为其模型框图。

Fij[n+1]=fFij[n]+Sij+W{y[n]}ij(1)

θij[n+1]=gθij[n]+hYij[n+1](3)

其中,外部刺激输入为矩阵S,神经元的当前状态矩阵为F[n+1],前一状态为F[n],W{*}表示神经元之间的连接。神经元输出为矩阵Y,如果Y为1表示神经元处于激发状态,如果为0表示处于熄灭状态。动态阈值矩阵为θ,θ根据用户的需求来进行设定。标量f和g小于1.0,令g<f,可确保阈值最终低于神经元的状态值,促使神经元激发,标量h是一个很大的值,在本文试验中取值20。当神经元激发时,使得阈值θ急剧增加,从而抑制神经元的脉冲发放,使其进入不应期,即在一定时期内不再发放脉冲。

2)、反馈式交叉视觉皮质模型:

在ICM迭代之后,同步激发的区域到一定时间会熄灭,这种熄灭叫做去同步,运用这种去同步的机制可以分割出图像的纹理信息。纹理带来的细小差异随着时间不断传播,最终造成神经元状态的改变,这样纹理信息就被提取出来。为了得到更好的纹理信息我们运用了一种反馈式交叉视觉皮质模型,反馈式交叉视觉皮质模型将ICMNN的输出以一种抑制性的方式反馈到输入,反馈式交叉视觉皮质模型与哺乳动物中老鼠的嗅觉系统类似。ICM在迭代过程中会将图像内部区域与边缘分离,但对于反馈式ICM,其输出会反馈至输入产生分流,从而对整个输入造成不均匀影响。这就是ICM与反馈式ICM的不同。

ICM迭代中激发的神经元将输出作为输入反馈给其它神经元,这样的话在迭代完之后需要一定的时间才能达到稳定状态。要想达到稳定,必须满足一定的条件,首先,输入值要求必须大于阈值,如果输入值过低,输入灰度值将会很快被衰减(衰减因子α)而最终消失。其次是输出必须安全进入所重脉冲发放阶段,在这种情况下所有处于激发状态的神经元将会一直激发。当满足次条件时,反馈和连接权矩阵会变成常量。事实上,输出是彼此独立的,而正是这些输出引起了网络中所有的其他波动。当输出稳定时,将不存在改变输入和其他网络参数的其他因素。

系统的反馈输入A按照公式(4)中的时间加权平均方式计算,这与ICM的动态阈值计算相似,差别在于常数V的取值不同。

其中VA比动态阈值中用到的V要小很多,在这里令VA=1,经过抑制性反馈计算后的输入为:

反馈式交叉皮层视觉模型在计算完每次迭代后进行公式(9)和(10)的运算。

2:分数幂指数滤波器(FPF):用ICM对剪影图像处理,可产生一个包含目标轮廓的脉冲图像,FPF的作用是在该脉冲图像区域进行搜索,如果有与目标边缘相似的候选目标,则会在其相关面内产生相关峰值。FPF是等相关峰综合鉴别函数滤波器(SDF)和最小平均相关能量滤波器(MACE)的扩展。

SDF的基本思想是:将某类图像及其畸变图像组成一个训练集,找出综合鉴别函数,综合鉴别函数的目的是寻求这样一个滤波函数:当正确目标输入时,相关面内有一相关峰值。

选出一组训练图像vi,令滤波器为h。SDF是输入加权线性组合,式(6)中矩阵V是通过输入向量的傅立叶变换的组合来创建的。

是V的傅立叶变换。每一个向量都和限制值Ci相关联,因此SDF滤波器h是通过下式来约束的

如式(8)用的逆矩阵去找到h,其中即为最小相关能量滤波器的傅里叶变换形式。为对傅里叶矩阵进行转置。[*]-1为对矩阵的逆运算。c是限制值,为以矩阵横坐标大小一列矩阵,其值大小为1。

平均最小相关能量滤波器(MACE)是在综合鉴别函数的基础上发展而来的[14],利用MACE能够使训练图像相关运算后的平均相关能量最小化。

MACE滤波器是通过下式计算得到:

D由式(10)构建而来,c为式(7)提到的限制值。就表示平均最小相关能量滤波器。

其中:

N为训练图像个数,δij是大小为d*d的对角矩阵,元素值为1,d大小为训练图像对角元素个数。是第K个训练图像的第i个元素。这样Dij就为大小为d*d的矩阵,其元素值就是每个训练图像相同位置的像素均值。

二维分数幂指数滤波器可按如下公式描述:

由式(13)构建,而由式(12)得到。c为式(7)中的限制值,D由式(10)得到。其中:

为d*1的矩阵,即训练图像的2D傅里叶变换转化成列向量。D-1/2表示对对角矩阵D开根号。

的元素由图像内部产生,的共轭。

公式(14)与公式(10)一样,幂项P=2则称之为最小平均相关能量滤波器,P=0式称之为鉴别函数滤波器,P处于0-2之间时称为分数幂指数滤波器FPF。

图6-8中显示的是三幅不同旋转角度下的骆驼剪影图像,利用这三幅图像可构建一个FPF,不同的P值的FPF对应的空间域图像如图9-11所示。可以看出,P值越大FPF对应的结果越接近训练图像的边缘。

3..反馈式ICM和FPF相结合的剪影识别:

在剪影识别中,如果仅用ICM和FPF对目标进行识别,得到的只是目标图像的增强,非目标图像依然存在,为了使效果更好,利用反馈式ICM对结果图像再进行处理,最后得到只有目标图像存在的图像。基于此,利用反馈式ICM结合FPF形成一个闭环系统实现剪影识别。

图12中显示了系统的工作流程:首先对输入的剪影图像进行ICM迭代产生边缘激发的图像,再对该图像进行边缘增强。输入训练图像到FPF中,得到边缘增强的图像。在原始图像边缘增强后的结果与FPF进行相关运算,得到相关峰值,对相关峰值最大点的区域进行修改,再把修改后的图像作为原始图像输入系统,最后得到目标图像在原图像上的增强。

实验步骤:

步骤1:对输入的剪影图像进行ICM迭代产生边缘激发的图像,再对该图像进行边缘增强。

步骤2:输入训练图像到FPF中,得到边缘增强的图像。

步骤3:将原始图像边缘增强后的结果与FPF进行相关运算,得到相关峰值。

步骤4:对相关峰值最大点的区域进行修改。

步骤5:把修改后的图像作为原始图像输入系统,最后得到目标图像上的增强。

实验中对系统性能进行测试,选用了Kimia剪影数据进行测试:

(1)、输入原始待识别图像和训练图像;

(2)、取FPF幂项P为0.3,原始待识别图像经过ICM后的图像与训练后的FPF相关得到的峰值为0.99;

(3)、设置不同的峰值门限,会得到不同的反馈增强的结果。可以得到,当阈值门限越大时,系统识别效果越好;

(4)、取P=0.4,产生的相关峰值为0.1;

(5)、再依次增大阈值门限可以得到和(3)中相同的结果。即阈值门限越大识别效果越好;

(6)、依次增大P的取值,重复(3)中的步骤可得P值越大图像边缘越明显,与原始图像产生的相关峰值越大,识别效果越好。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号