首页> 中国专利> 一种基于图像局部对比度的自适应颜色恒常性方法

一种基于图像局部对比度的自适应颜色恒常性方法

摘要

本发明公开一种基于图像局部对比度的自适应颜色恒常性方法,针对目前的颜色恒常算法,不能适用于所有数据集,灵活性较差的问题,本发明通过图像局部对比度来自适应地调节高斯差函数(Difference of Gaussian,DoG)的核函数大小和中心‑外周感受野的抑制权重来模拟大脑视觉自适应信息处理机制,高级视觉皮层V4区通过自适应的稀疏编码方式整合来自于低级视觉皮层V1区的输入信号,从而估计出场景的光源颜色;实现在不同数据集上设置相同的参数,都能取得很好的效果;并且十分高效,可以很好的估计出光源的位置和颜色,对图像进行实时颜色校正。

著录项

  • 公开/公告号CN108537852A

    专利类型发明专利

  • 公开/公告日2018-09-14

    原文格式PDF

  • 申请/专利权人 四川大学;

    申请/专利号CN201810341563.5

  • 申请日2018-04-17

  • 分类号

  • 代理机构成都虹盛汇泉专利代理有限公司;

  • 代理人王伟

  • 地址 610065 四川省成都市武侯区一环路南一段24号

  • 入库时间 2023-06-19 06:29:52

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-03-24

    未缴年费专利权终止 IPC(主分类):G06T 7/90 专利号:ZL2018103415635 申请日:20180417 授权公告日:20200707

    专利权的终止

  • 2020-07-07

    授权

    授权

  • 2018-10-16

    实质审查的生效 IPC(主分类):G06T7/90 申请日:20180417

    实质审查的生效

  • 2018-09-14

    公开

    公开

说明书

技术领域

本发明属于计算机视觉、图像处理、人工智能、信号处理和认知科学等学科相关的技术领域,特别涉及一种从彩色图像中估计场景的光源颜色,实现图像颜色校正的技术。

背景技术

视觉计算是一个相当广泛的领域,颜色恒常性强调我们的视觉系统对外界物体颜色感知的恒常性,是指从感官信息中抽取出最稳定的视觉颜色信息,获得对外界物体最本质的认识,人类视觉系统能够自动地去除场景中由于光源颜色变化所导致的场景色偏的能力称之为颜色恒常性。

颜色恒常性可以从不同的角度来分析,比如计算机视觉、光学、心理学等。我们把视觉中的颜色恒常性作为视觉的底层或者中级信息处理,表征了视觉对颜色的感知,而视觉的自适应性可以理解为神经元层面上的短时可塑性,视觉系统可以根据外界刺激的变化相应的改变对外界刺激的响应过程,让视觉信息的处理跟上外界信号的变化,从而能够利用空间和时间上的信号统计结构信息。从知觉的角度,视觉自适应能够影响我们对物体的判断,使得视觉系统具有知觉恒常性,比如对刺激中光照颜色变化的自适应可以使视觉系统保持对物体颜色的恒定感知。

颜色恒常性已经有很多算法提出,比如D.A.Forsyth的“A novel algorithm forcolor constancy,International Journal of Computer Vision,vol.5,no.1,pp.5–35,1990”,以及A.Gijsenij和T.Gevers提出的“Color constancy using natural imagestatistics and scene semantics,Pattern Analysis and Machine Intelligence,IEEETransactions on,vol.33,no.4,pp.687–698,2011.”都是针对特定数据集和特定场景提出的。

目前为止,没有一个算法是适用于几乎所有的数据集,灵活性比较差,不适用于实时处理。

发明内容

为解决上述技术问题,本发明提出一种基于图像局部对比度的自适应颜色恒常性方法,在不同数据集上设置相同的参数,都能取得很好的效果,并且十分高效,可以很好的估计出光源的位置和颜色,对图像进行实时颜色校正。

本发明采用的技术方案为:一种基于图像局部对比度的自适应颜色恒常性方法,包括:

S1、通过计算每个像素的局部标准差来获得图像的局部对比度;

S2、将原始图像分成R、G、B三个颜色通道,每一个颜色通道根据步骤S1计算得到的局部对比度选择高斯核的尺寸,进行卷积,得到V1区神经元中心感受野的响应CR;

S3、将原始图像分成R、G、B三个颜色通道,每一个颜色通道与一个固定尺度的高斯核做卷积,得到V1区神经元外周感受野的响应SR;

S4、整合S2和S3计算得到的V1区神经元感受野的中心响应CR和外周响应SR得到V1区神经元的最终输出RR;

S5、V4区神经元通过稀疏编码的方式对V1区神经元的输出RR进行整合得到估计的光源颜色;

S6、消除光源颜色实现颜色恒常性;将原始图像中的像素除以对应光源颜色图中的像素得到校正后的无色偏图像。

进一步地,步骤S2所述每一个颜色通道根据步骤S1计算得到的局部对比度选择高斯核的尺寸大小,具体为:根据步骤S1得到的局部对比度将各通道图像划分为若干层级,每一层级的通道图像对应一个高斯核;且高斯核的尺度与局部对比度成反比,局部对比度较大的层级对应的高斯核尺度较小;局部对比度较小的层级对应的高斯核尺度较大。

更进一步地,所述高斯核取值范围为[σ,2σ]。

进一步地,步骤S3所述固定尺度的高斯核尺度取值为5σ。

进一步地,步骤S4中所述得到V1区神经元的最终输出RR,其具体计算方式为:

RR=λCR+κSR;

其中,λ表示中心感受野的权重,λ的取值范围[1,1.05],κ表示外周感受野的权重,κ取值范围为[-0.67,-0.77]。

进一步地,步骤S5所述对V1区神经元的输出RR进行整合,具体为:V4区神经元根据设定的自适应性的激活阈值从V1区神经元的输出RR中选择活跃度比较高的神经元响应来估计光源颜色。

更进一步地,所述选取的活跃度比较高的V1区神经元的比例与V1区神经元输出RR的平均对比度成反比。

本发明的有益效果:本发明的一种基于图像局部对比度的自适应颜色恒常性方法,通过图像局部对比度来自适应地调节高斯差函数(Difference of Gaussian,DoG)的核函数大小和中心-外周感受野的抑制权重来模拟大脑视觉自适应信息处理机制,高级视觉皮层V4区通过自适应的稀疏编码方式整合来自于低级视觉皮层V1区的输入信号,从而估计出场景的光源颜色;本发明初始化参数N、σ、λ、κ后能够应用于不同的数据集,不需要重新校正模型参数,从而实现自适应的颜色恒常性;本发明的方法可内嵌于相机内部,进行实时地图像颜色校正和处理,恢复出场景的真实颜色。

附图说明

图1为本发明的方法流程图;

图2为本发明实施例提供的V1区感受野的示意图;

图3为本发明实施例提供的V4区对V1区中活跃的神经元进行池化的示意图;

图4为本发明实施例提供的颜色恒常算法后得到的结果;

其中,图4(a)为输入的原始色偏图像,图4(b)为通过本发明方法得到的校正后的颜色恒常图像。

具体实施方式

为便于本领域技术人员理解本发明的技术内容,下面结合附图对本发明内容进一步阐释。

如图1所示为本发明的方案流程图,本发明采用的技术方案为:一种基于图像局部对比度的自适应颜色恒常方法,包括:

S1、通过计算每个像素的局部标准差来获得图像的局部对比度;

S2、将原始图像分成R、G、B三个颜色通道,每一个颜色通道根据步骤S1计算得到的局部对比度选择高斯核的尺寸大小,进行卷积,得到V1区神经元中心感受野的响应CR;

S3、将原始图像分成R、G、B三个颜色通道,每一个颜色通道与一个固定尺度的高斯核做卷积,得到V1区神经元外周感受野的响应SR;

V1区神经元感受野如图2所示;

S4、整合S2和S3计算得到的V1区神经元感受野的中心响应CR和外周响应SR得到V1区神经元的最终输出RR;

S5、V4区神经元通过稀疏编码的方式对V1区神经元的输出RR进行整合得到估计的光源颜色;

S6、消除光源颜色实现颜色恒常性;将原始图像中的像素除以步骤S5计算出的对应光源颜色图中的像素得到校正后的无色偏图像。

步骤S1中图像局部对比度计算方式为:

其中,Ic(x,y)表示一幅输入的彩色图像,(x,y)表示像素的空间坐标,c表示某个颜色通道,c∈{R,G,B};d表示滤波模板的某一空间方向,空间方向包括:水平、竖直或者各向同性;μd(σ)表示在d方向上尺寸大小为σ的滤波模板;*代表卷积运算,σ的取值为1.5。

在水平对比度下(即d为水平方向),μd(σ)是列向量;在竖直对比度(即d为竖直方向),μd(σ)是行向量,在各向同性对比度下(即d为各向同性),μd(σ)是一个方阵。

步骤S2所述V1区神经元中心感受野的响应CR计算式为:

CRc(x,y)=Ic(x,y)*gc(x,y;sc,h(x,y),sc,v(x,y))(2)

其中,sc,h(x,y)和sc,v(x,y)分别是水平和垂直维度上的高斯核,gc(x,y;sc,h(x,y),sc,v(x,y))为二维高斯核函数;gc(x,y;sc,h(x,y),sc,v(x,y))为卷积公式,表示每个颜色通道都使用相同的二维高斯核函数进行卷积,所述的二维高斯核函数计算式为:

其中,σd是方向d上的高斯核的尺度大小,中心感受野的大小与图像局部对比度成反比,用下面公式表示:

其中,

本发明通过将图像像素基于对比度分成不同的层级,然后使用不同尺度大小的高斯核对相应对比度层级的像素进行卷积,比如将低对比度的图像像素和较大尺度的高斯核进行卷积,而将高对比度的图像像素和较小尺度的高斯核进行卷积来计算中心响应CRc

步骤S3所述V1区神经元外周感受野的响应SR的计算式为:

SRc(x,y)=Ic(x,y)*gc(x,y;5σ,5σ)(5)

其中,高斯核的大小在不同的方向和对比度上都是恒定不变的。

步骤S4所述V1区神经元的最终输出RR计算式为:

RRc(x,y)=λc(x,y)CRc(x,y)+κc(x,y)SRc(x,y)(6)

其中,λc(x,y)和κc(x,y)是中心感受野和外周感受野的权重,这些参数模拟了神经元中心感受野和外周感受野的抑制强度,且依赖于神经元中心感受野和外周感受野的对比度和相关方向。

λc(x,y)和κc(x,y)的值反比于中心感受野和外周感受野的对比度:

其中,i表示空间方向,∝为正比符号,

V4区对V1区中活跃的神经元进行池化如图3所示,步骤S5的计算式为:

Lc=RRc(bc)(9)

其中,在S4中得到的V1区的输出RRc是由三个颜色通道组成(c∈{R,G,B}),本发明中定义Lc为c通道中估计到的光源颜色,定义Hc为RRc的直方图,RRc(bc)是直方中相应比例激活神经元(bc)响应的求和,定义pc为V1区神经元输出RRc的平均对比度,pc计算如下:

其中,n为V1区神经元输出RRc响应的个数,Fc为通过V4区神经元感受野计算得到的V1区神经元输出RRc的局部对比度:

选取一个具有自适应性的激活阈值npc,npc代表了用来估计光源颜色的激活神经元数量的上限:

这里nb表示直方图Hc中所有bin的个数,也就是说当高度激活的神经元的数量达到npc时,即选择相应神经元bc并对其响应求和获得最终的光源颜色估计(公式9)。

步骤S6具体为:整个图像上所有的像素依次进行校正,具体的:利用步骤S5估计得到的光源颜色对原始图像的像素进行颜色校正。

以下通过具体数据对本发明的内容做进一步地的阐述:

从国际上通用的SFU Lab数据集中选取一张图片(yellowtable.pgn),图像大小为368*245;图1所示为本发明的方案流程图,本发明的技术方案为:一种新的基于图像局部对比度的自适应颜色恒常性算法,包括:

S1、通过计算每个像素的局部标准差来获得图像的局部对比度C;

以输入的大小为368*245的图片中的两个像素为例,在S1中计算得到的每个像素的局部对比度C为0.3781和0.2308。

S2、将原始图像I分成{R,G,B}三个颜色通道,分别与一个较小尺度的高斯核做卷积得到V1区神经元中心感受野的响应CR;

在计算过程中,以R通道为例子,简单地将图像的局部对比度分成两个等级(即N=2),对于低对比度值(0.2308)的像素,使用一个较大尺度的中心感受野(15*15)卷积后得到的CR结果为0.1917,而对于高对比度值(0.3781)的像素使用一个较小尺度的中心感受野(3*3)卷积后的CR结果为0.540。

S3、将原始图像I分成{R,G,B}三个颜色通道,分别与一个较大尺度的高斯核做卷积得到V1区神经元外周感受野的响应SR;

在计算过程中,以R通道为例子,低对比度值(0.2308)的像素、高对比度值(0.3781)的像素两个像素分别与一个固定尺度的高斯核(75*75)卷积计算得到外周响应SR分别为0.1224和0.3944。

S4、整合S2和S3计算得到的V1区神经元感受野的中心响应CR和外周响应SR得到V1区神经元的最终输出RR;

在计算过程中,以R通道为例子,以中心感受野响应CR(0.540)和外周感受野响应SR(0.3944)为例子,基于S4步骤RR=λCR+κSR,其中以κ取值-0.67,λ取值1为例子,得到RR的值为0.540-0.67*0.3944=0.2758。

S5、V4区神经元通过稀疏编码的方式对V1区神经元的输出RR进行整合得到估计的光源颜色;

在S5中,对V1区中的输出,即S4中得到的结果进行池化操作(求和或者选取最大值),相当于对低级视觉皮层V1区中的信息进行整合处理,选取每个通道中最活跃的神经元的值作为winner输入V4区;这里以求和为例子,池化后得到的结果为:0.5551,0.3168,0.1281,该值也就是估计的光源颜色。

S6、消除光源颜色实现颜色恒常性。将原始图像I中的像素除以对应光源颜色图中的像素得到校正后的无色偏图像。

以原始图像I中的像素(0.3134,0.1470,0.1746)为例子,利用S5估计得到的光源颜色对原始图像的像素进行颜色校正后的结果为(0.3134/0.5551,0.1470/0.3168,0.1746/0.1281)=(0.5646,0.4640,1.3630)。

以上的简单实例主要以图像的单个像素值为例子来阐述,实际计算时是在整个图像上所有的像素来进行的。图4(a)为输入的原始图像,图4(b)是利用步骤S5的光源颜色值对原始图像进行校正的结果。该算法在将生理上的计算模型应用到图像处理时,具有较少自由变量的情况下达到预期目的,在不同的数据集上都取得较好的效果。

本发明初始化参数N、σ、λ、κ后能够应用于不同的数据集,不需要重新校正模型参数,从而实现自适应的颜色恒常性。

本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号