法律状态公告日
法律状态信息
法律状态
2016-05-11
授权
授权
2014-04-09
实质审查的生效 IPC(主分类):G06T5/00 申请日:20131129
实质审查的生效
2014-03-12
公开
公开
技术领域
本发明涉及计算机视觉及数字图像处理领域,更具体地说,涉及一种非线 性图像多尺度几何分析方法。
背景技术
随着计算机视觉和数字图像处理技术的发展,近年来出现了许多新的图像 表示和处理工具。其中多尺度几何分析由于具有多分辨率、时频局部化、多方 向性等特性,已成为图像理解领域的代表性理论框架,使得在图像不同分辨率 的细节中提取不同的目标结构特征变为可能,大大提升了各种图像处理应用的 性能。此外,多尺度几何分析基函数的支撑区间表现为具有随尺度而长宽比变 化的“各向异性”特性,能够更有效的实现对图像的稀疏表示。
在图像多尺度几何分析方法中,代表性的有Ridgelet、Curvelet、Bandelet、 Contourlet和Shearlet变换等。这些变换多采用线性多尺度分解策略,实现简单, 结构成熟,但它们存在两方面的不足:(1)变换域的系数稀疏度不足,且不同 子带系数之间的依赖性比较大;(2)线性采样和插值易造成边缘模糊,图像细 节损失多。
研究表明非线性滤波器在图像信息处理中具有独特的优势,因其能够从采 样图像中去除大量的无用信息且又能降低边缘模糊效应。鉴于此,加强对图像 多尺度几何表示方法的非线性化研究是解决传统多尺度几何表示方法不足的核 心所在。然而非线性多尺度分解方法的滤波器选择具有多样性,且非线性多尺 度数据结构的构建方式也相对复杂,使得图像的非线性多尺度几何表示问题一 直没有得到深入地研究和解决。鉴于此,研究有效的、简单易实现的图像非线 性多尺度几何表示方法对于图像压缩、图像检索、图像融合等应用系统的研制 都非常有价值。
发明内容
本发明为了有效解决非线性图像多尺度几何表示问题,提出了一种非线性 图像多尺度几何表示方法。本方法明显提高了多尺度几何变换域系数的稀疏度 且图像细节保持能力强,同时实现相对于其它非线性滤波更为简单,运算量小。
本发明的技术方案是:一种非线性图像多尺度几何表示方法,具体实现过 程包括下述步骤:
设FIR中值混合滤波器对输入图像i(m,n)的滤波结果为图像H(m,n),具体 滤波过程如下式所示:
上式中,y1(m,n)=MED{MED[Subset1(m,n)],i(m,n),MED[Subset2(m,n)]},
y2(m,n)=MED{MED[Subset3(m,n)],i(m,n),MED[Subset4(m,n)]},
Subset1(m,n)={i(m,n+q):q∈[-N,N]\{0}}
Subset2(m,n)={i(m+q,n):q∈[-N,N]\{0}}
Subset3(m,n)={i(m+q,n+q):q∈[-N,N]\{0}}
Subset4(m,n)={i(m-q,n+q):q∈[-N,N]\{0}}
MED为取中值操作,m∈[1,Nir],n∈[1,Nic],Nir是图像i(m,n)的行数,Nic是 图像i(m,n)的列数,FIR中值混合滤波器的行数和列数都是2N+1且Nir>2N+1, Nic>2N+1。
对于任意尺度j,j=1,…,M,M为尺度分解层数。将待处理图像f(m,n)记 为原始输入图像f1(m,n)。令j=1,然后进行下述过程:
步骤①:利用FIR中值混合滤波器对图像fj(m,n)进行滤波,得到图像 Hj(m,n);
步骤②:对图像Hj(m,n)按隔行隔列方式进行降2采样,得到下采样图像
步骤③:对下采样图像按下式进行基于中值的升2插值滤波,得到 插值估计图像
上式中,z=MED{z1,z2,z3}
步骤④:将图像fj(m,n)与插值估计图像相减得第j尺度层非线性金 字塔分解图像
步骤⑤:将fj+1(m,n)更新为下采样图像令j=j+1,返回步骤①。
重复M次步骤①至⑤后,得到M层非线性金字塔分解图像序列
对任意尺度j,j=1,…,M,将第j尺度层非线性金字塔分解图像按 下式进行Shear方向滤波得子带图像fj,l(m,n):
上式中,
l=1,…,D为方向编号,D为方向滤波个数;代表在伪极坐标系中δ 函数的离散傅里叶变换;为Meyer小波频域窗函数,并满足 为从伪极坐标系到笛卡尔坐标系转换的映射函数。Nr为 的行数,Nc为的列数。Nr的取值小于或等于图像的行数,Nc的取 值小于或等于图像的列数。
对M层非线性金字塔分解图像序列分别进行D个方向的Shear方向滤波, 得到的子带图像序列f1,1(m,n),f1,2(m,n),…,f1,D(m,n),…,fM,1(m,n),fM,2(m,n),…fM,D(m,n)就 是本发明提供的待处理图像f(m,n)的非线性多尺度几何表示结果。
本发明的有益效果是:利用FIR中值混合滤波器对图像进行非线性金字塔 分解能够去除图像大量的无用信息且又能够降低边缘模糊效应;Shear方向滤波 器具有多方向各向异性几何分析和最优的非线性逼近能力,且实现方式快捷; 结合FIR中值混合滤波器和Shear方向滤波器,本发明提出的非线性图像多尺度 几何表示方法,不仅能够提高子带图像系数的稀疏度,降低系数间的依赖性; 还能够提高边缘细节捕捉和保持能力,有利于后续图像特征提取,是一种性能 优良的图像非线性多尺度几何表示方法。此外,基于FIR中值混合滤波的离散 Shearlet变换只涉及一些简单的算术运算(中值、卷积等),运算量少,在图像 压缩、边缘提取、纹理检索等方面具有较高的应用价值。
附图说明
图1为本发明提供的非线性图像多尺度几何表示方法的流程图;
图2为本发明提供的方法对实验图像Lena的多尺度几何表示结果;
图3为利用本发明提供的方法和传统离散Shearlet变换方法对实验图像 House表示后再进行边缘提取的结果对比图。
具体实施方式
下面结合附图对本发明提供的非线性图像多尺度几何表示方法进行详细说 明。
图1为本发明提供的非线性图像多尺度几何表示方法的流程图。
该流程图的第一步是构建FIR中值混合滤波器,通过获取四个方向子滤波 器对图像的采样子集Subset1(m,n)、Subset2(m,n)、Subset3(m,n)和Subset4(m,n)并计算 采样子集的中值来实现。每一个子滤波器都被设计成用于保留某一方向的细节 信息,FIR中值混合滤波器结合多个方向的子滤波器,能够很好地捕获和保留图 像各个方向的边缘细节信息。此外子滤波器不同的采样方式可以构建出不同的 FIR中值混合滤波器。
第二步是图像非线性金字塔分解,对应于发明内容的步骤①至⑤。对于 j=1,…,M,M为尺度分解层数。首先对图像fj(m,n)进行FIR中值混合滤波得 Hj(m,n),然后对Hj(m,n)隔行隔列降2采样得其次对进行 基于中值的升2插值滤波得最后将fj(m,n)与相减得第j尺度 层非线性金字塔分解图像
当j=1时,f1(m,n)为待处理图像。当j>1时,fj(m,n)用上一层的下采样 图像替换,重复上述过程M次后就得到M层图像非线性金字塔分解序 列M的取值根据实际应用和图像多尺度几何表示 精度确定,一般取值范围为[2,4]。M越大,进行非线性金字塔分解的次数越 多,计算量也越大。
第三步是非线性金字塔分解图像的Shear方向滤波。利用Shear方向滤波器 对任意尺度层j的非线性金字塔图像进行D个方向滤波,得到子带图像 序列fj,1(m,n),…,fj,D(m,n)。D的取值根据实际应用和图像多尺度几何表示精度 确定,一般取值为2的幂次方,如4,8,16等。
图2为本发明提供的方法对实验图像Lena的多尺度几何表示结果。为了简 单起见,令M=2,D=4,即对图像进行2层非线性金字塔分解和4个方向的 Shear方向滤波。其中,子图(a)为实验图像Lena,子图(b)由左至右分别为第2 尺度层的0、π/4、π/2、3π/4这4个方向的子带图像,子图(c)由左至右分别为第 1尺度层的0、π/4、π/2、3π/4这4个方向子带图像。
可以看出,子带图像边缘细节处的系数幅值都较大,清晰刻画了图像的轮 廓结构信息。利用系数互信息量来衡量系数间依赖性的大小,具体算法可参照 T.M.Cover的Elements of Information Theory。通过计算多组实验图像(如Lena 等)的子带图像序列的系数互信息量可得,利用本发明提供的方法得到的子带 图像序列,其系数互信息量比传统离散Shearlet变换平均降低了0.1左右,从而 验证了用本发明所提的方法对图像进行多尺度几何表示,子带图像序列的系数 间依赖性更低,即系数之间的冗余信息量少这一优点。通过计算多组实验图像 (如Lena等)子带图像序列的熵值和非零系数比可得,利用本发明提供的方法 得到的子带图像序列,其熵值相对于传统离散Shearlet变换平均降低了0.071左 右,非零系数比降低了0.04左右,从而验证了用本发明所提的方法对图像进行 多尺度几何表示,子带图像序列的系数稀疏度高这一优点。
图3为利用本发明所提供的方法和传统离散Shearlet变换方法对实验图像 House表示后再进行边缘提取的结果对比图。具体实现中,M=3尺度分解层数 都为3层。其中,子图(a)为实验图像House,子图(b)由左至右分别为传统离散 Shearlet变换表示后得到的1至3层边缘提取图像,子图(c)由左至右分别为基 于本发明提供的方法表示后得到的1至3层边缘提取图像。
由子图(b)可知图像细节捕捉能力较差,只能捕捉一些比较明显轮廓边缘信 息,遗失了很多重要的信息。相比之下,子图(c)的边缘提取结果更完整,且边 缘定位相对更准确,体现出本发明所提供的表示方法对图像细节捕捉和保持能 力强的优点。
以上所述的本发明实施方式,并不构成对本发明保护范围的限定,任何在 本发明精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明的 权利要求保护范围之内。
机译: 一种设备,可以执行几乎无穷无尽的形状和数量不同的几何形状或几何形状的迹线,并且可以在不同尺寸的可变尺度上以绝对精度进行复制
机译: 一种用于分配图像和音频投影位置的数字信息的设备。一种用于在选定位置传输表示图像的数据的设备,一种用于显示表示由该设备传输的数据的图像的设备
机译: 使用尺度不变图像特征的量化嵌入来表示图像的方法