首页> 中国专利> 一种非线性图像多尺度几何表示方法

一种非线性图像多尺度几何表示方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明提供一种非线性图像多尺度几何表示方法。技术方案包括以下步骤：步骤①：利用FIR中值混合滤波器对图像进行滤波；步骤②：对滤波后图像按隔行隔列方式进行降2采样，得到下采样图像；步骤③：对下采样图像按进行基于中值的升2插值滤波，得到插值估计图像；步骤④：将原图像与插值估计图像相减得多个尺度层非线性金字塔分解图像；步骤⑤：将每个尺度层非线性金字塔分解图像进行Shear方向滤波得子带图像。本发明是一种性能优良的图像非线性多尺度几何表示方法，运算量少，在图像压缩、边缘提取、纹理检索等方面具有较高的应用价值。

著录项

公开/公告号CN103632348A

专利类型发明专利
公开/公告日2014-03-12

原文格式PDF
申请/专利权人中国人民解放军国防科学技术大学;
展开▼

申请/专利号CN201310625611.0
发明设计人雷琳;周石琳;刘俊良;邹焕新;计科峰;李智勇;孙浩;侯毅;
展开▼

申请日2013-11-29
分类号G06T5/00;
代理机构国防科技大学专利服务中心;
代理人王文惠
地址 410073 湖南省长沙市开福区德雅路109号
入库时间 2024-02-19 23:15:09

法律信息

法律状态公告日

法律状态信息

法律状态
2016-05-11

授权

授权
2014-04-09

实质审查的生效 IPC(主分类):G06T5/00 申请日:20131129

实质审查的生效
2014-03-12

公开

公开

说明书

技术领域

本发明涉及计算机视觉及数字图像处理领域，更具体地说，涉及一种非线性图像多尺度几何分析方法。

背景技术

随着计算机视觉和数字图像处理技术的发展，近年来出现了许多新的图像表示和处理工具。其中多尺度几何分析由于具有多分辨率、时频局部化、多方向性等特性，已成为图像理解领域的代表性理论框架，使得在图像不同分辨率的细节中提取不同的目标结构特征变为可能，大大提升了各种图像处理应用的性能。此外，多尺度几何分析基函数的支撑区间表现为具有随尺度而长宽比变化的“各向异性”特性，能够更有效的实现对图像的稀疏表示。

在图像多尺度几何分析方法中，代表性的有Ridgelet、Curvelet、Bandelet、 Contourlet和Shearlet变换等。这些变换多采用线性多尺度分解策略，实现简单，结构成熟，但它们存在两方面的不足：（1）变换域的系数稀疏度不足，且不同子带系数之间的依赖性比较大；（2）线性采样和插值易造成边缘模糊，图像细节损失多。

研究表明非线性滤波器在图像信息处理中具有独特的优势，因其能够从采样图像中去除大量的无用信息且又能降低边缘模糊效应。鉴于此，加强对图像多尺度几何表示方法的非线性化研究是解决传统多尺度几何表示方法不足的核心所在。然而非线性多尺度分解方法的滤波器选择具有多样性，且非线性多尺度数据结构的构建方式也相对复杂，使得图像的非线性多尺度几何表示问题一直没有得到深入地研究和解决。鉴于此，研究有效的、简单易实现的图像非线性多尺度几何表示方法对于图像压缩、图像检索、图像融合等应用系统的研制都非常有价值。

发明内容

本发明为了有效解决非线性图像多尺度几何表示问题，提出了一种非线性图像多尺度几何表示方法。本方法明显提高了多尺度几何变换域系数的稀疏度且图像细节保持能力强，同时实现相对于其它非线性滤波更为简单，运算量小。

本发明的技术方案是：一种非线性图像多尺度几何表示方法，具体实现过程包括下述步骤：

设FIR中值混合滤波器对输入图像i(m,n)的滤波结果为图像H(m,n)，具体滤波过程如下式所示：

上式中，y₁(m,n)=MED{MED[Subset₁(m,n)],i(m,n),MED[Subset₂(m,n)]}，

y₂(m,n)=MED{MED[Subset₃(m,n)],i(m,n),MED[Subset₄(m,n)]}，

Subset₁(m,n)={i(m,n+q):q∈[-N,N]\{0}}

Subset₂(m,n)={i(m+q,n):q∈[-N,N]\{0}}

Subset₃(m,n)={i(m+q,n+q):q∈[-N,N]\{0}}

Subset₄(m,n)={i(m-q,n+q):q∈[-N,N]\{0}}

MED为取中值操作，m∈[1,N_ir]，n∈[1,N_ic]，N_ir是图像i(m,n)的行数，N_ic是图像i(m,n)的列数，FIR中值混合滤波器的行数和列数都是2N+1且N_ir>2N+1, N_ic>2N+1。

对于任意尺度j，j=1,…,M，M为尺度分解层数。将待处理图像f(m,n)记为原始输入图像f¹(m,n)。令j=1，然后进行下述过程：

步骤①：利用FIR中值混合滤波器对图像f^j(m,n)进行滤波，得到图像 H^j(m,n)；

步骤②：对图像H^j(m,n)按隔行隔列方式进行降2采样，得到下采样图像

步骤③：对下采样图像按下式进行基于中值的升2插值滤波，得到插值估计图像

$(\begin{matrix} H_{2}^{j} (2 m - 1,2 n - 1) = H_{1}^{j} (m, n) \\ H_{2}^{j} (2 m - 1,2 n) = [H_{1}^{j} (m, n) + H_{1}^{j} (m, n + 1)] / 2 \\ H_{2}^{j} (2 m, 2 n - 1) = [H_{1}^{j} (m + 1, n) + H_{1}^{j} (m, n)] / 2 \\ H_{2}^{j} (2 m, 2 n) = MED {H_{1}^{j} (m, n), H_{1}^{j} (m, n + 1), H_{1}^{j} (m + 1, n), H_{1}^{j} (m + 1, n + 1), z} \end{matrix})$

上式中，z=MED{z₁,z₂,z₃}

$(\begin{matrix} z_{1} = [H_{1}^{j} (m, n) + H_{1}^{j} (m + 1, n + 1)] / 2, z_{2} = [H_{1}^{j} (m, n + 1) + H_{1}^{j} (m + 1, n)] / 2 \\ z_{3} = [H_{1}^{j} (m, n) + H_{1}^{j} (m + 1, n + 1) + H_{1}^{j} (m, n + 1) + H_{1}^{j} (m + 1, n)] / 4 \end{matrix})$

步骤④：将图像f^j(m,n)与插值估计图像相减得第j尺度层非线性金字塔分解图像

步骤⑤：将f^j+1(m,n)更新为下采样图像令j=j+1，返回步骤①。

重复M次步骤①至⑤后，得到M层非线性金字塔分解图像序列

对任意尺度j，j=1,…,M，将第j尺度层非线性金字塔分解图像按下式进行Shear方向滤波得子带图像f^j,l(m,n)：

$f^{j, l} (m, n) = f_{d}^{j} (m, n) * w_{j, l}^{s} (m, n)$

上式中，

l=1,…,D为方向编号，D为方向滤波个数；代表在伪极坐标系中δ 函数的离散傅里叶变换；为Meyer小波频域窗函数，并满足为从伪极坐标系到笛卡尔坐标系转换的映射函数。N_r为的行数，N_c为的列数。N_r的取值小于或等于图像的行数，N_c的取值小于或等于图像的列数。

对M层非线性金字塔分解图像序列分别进行D个方向的Shear方向滤波，得到的子带图像序列f^1,1(m,n),f^1,2(m,n),…,f^1,D(m,n),…,f^M,1(m,n),f^M,2(m,n),…f^M,D(m,n)就是本发明提供的待处理图像f(m,n)的非线性多尺度几何表示结果。

本发明的有益效果是：利用FIR中值混合滤波器对图像进行非线性金字塔分解能够去除图像大量的无用信息且又能够降低边缘模糊效应；Shear方向滤波器具有多方向各向异性几何分析和最优的非线性逼近能力，且实现方式快捷；结合FIR中值混合滤波器和Shear方向滤波器，本发明提出的非线性图像多尺度几何表示方法，不仅能够提高子带图像系数的稀疏度，降低系数间的依赖性；还能够提高边缘细节捕捉和保持能力，有利于后续图像特征提取，是一种性能优良的图像非线性多尺度几何表示方法。此外，基于FIR中值混合滤波的离散 Shearlet变换只涉及一些简单的算术运算（中值、卷积等），运算量少，在图像压缩、边缘提取、纹理检索等方面具有较高的应用价值。

附图说明

图1为本发明提供的非线性图像多尺度几何表示方法的流程图；

图2为本发明提供的方法对实验图像Lena的多尺度几何表示结果；

图3为利用本发明提供的方法和传统离散Shearlet变换方法对实验图像 House表示后再进行边缘提取的结果对比图。

具体实施方式

下面结合附图对本发明提供的非线性图像多尺度几何表示方法进行详细说明。

图1为本发明提供的非线性图像多尺度几何表示方法的流程图。

该流程图的第一步是构建FIR中值混合滤波器，通过获取四个方向子滤波器对图像的采样子集Subset₁(m,n)、Subset₂(m,n)、Subset₃(m,n)和Subset₄(m,n)并计算采样子集的中值来实现。每一个子滤波器都被设计成用于保留某一方向的细节信息，FIR中值混合滤波器结合多个方向的子滤波器，能够很好地捕获和保留图像各个方向的边缘细节信息。此外子滤波器不同的采样方式可以构建出不同的 FIR中值混合滤波器。

第二步是图像非线性金字塔分解，对应于发明内容的步骤①至⑤。对于 j=1,…,M，M为尺度分解层数。首先对图像f^j(m,n)进行FIR中值混合滤波得 H^j(m,n)，然后对H^j(m,n)隔行隔列降2采样得其次对进行基于中值的升2插值滤波得最后将f^j(m,n)与相减得第j尺度层非线性金字塔分解图像

当j=1时，f¹(m,n)为待处理图像。当j>1时，f^j(m,n)用上一层的下采样图像替换，重复上述过程M次后就得到M层图像非线性金字塔分解序列M的取值根据实际应用和图像多尺度几何表示精度确定，一般取值范围为[2，4]。M越大，进行非线性金字塔分解的次数越多，计算量也越大。

第三步是非线性金字塔分解图像的Shear方向滤波。利用Shear方向滤波器对任意尺度层j的非线性金字塔图像进行D个方向滤波，得到子带图像序列f^j,1(m,n),…,f^j,D(m,n)。D的取值根据实际应用和图像多尺度几何表示精度确定，一般取值为2的幂次方，如4，8，16等。

图2为本发明提供的方法对实验图像Lena的多尺度几何表示结果。为了简单起见，令M=2，D=4，即对图像进行2层非线性金字塔分解和4个方向的 Shear方向滤波。其中，子图(a)为实验图像Lena，子图(b)由左至右分别为第2 尺度层的0、π/4、π/2、3π/4这4个方向的子带图像，子图(c)由左至右分别为第 1尺度层的0、π/4、π/2、3π/4这4个方向子带图像。

可以看出，子带图像边缘细节处的系数幅值都较大，清晰刻画了图像的轮廓结构信息。利用系数互信息量来衡量系数间依赖性的大小，具体算法可参照 T.M.Cover的Elements of Information Theory。通过计算多组实验图像（如Lena 等）的子带图像序列的系数互信息量可得，利用本发明提供的方法得到的子带图像序列，其系数互信息量比传统离散Shearlet变换平均降低了0.1左右，从而验证了用本发明所提的方法对图像进行多尺度几何表示，子带图像序列的系数间依赖性更低，即系数之间的冗余信息量少这一优点。通过计算多组实验图像（如Lena等）子带图像序列的熵值和非零系数比可得，利用本发明提供的方法得到的子带图像序列，其熵值相对于传统离散Shearlet变换平均降低了0.071左右，非零系数比降低了0.04左右，从而验证了用本发明所提的方法对图像进行多尺度几何表示，子带图像序列的系数稀疏度高这一优点。

图3为利用本发明所提供的方法和传统离散Shearlet变换方法对实验图像 House表示后再进行边缘提取的结果对比图。具体实现中，M=3尺度分解层数都为3层。其中，子图(a)为实验图像House，子图(b)由左至右分别为传统离散 Shearlet变换表示后得到的1至3层边缘提取图像，子图(c)由左至右分别为基于本发明提供的方法表示后得到的1至3层边缘提取图像。

由子图(b)可知图像细节捕捉能力较差，只能捕捉一些比较明显轮廓边缘信息，遗失了很多重要的信息。相比之下，子图(c)的边缘提取结果更完整，且边缘定位相对更准确，体现出本发明所提供的表示方法对图像细节捕捉和保持能力强的优点。

以上所述的本发明实施方式，并不构成对本发明保护范围的限定，任何在本发明精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明的权利要求保护范围之内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种非线性图像多尺度几何表示方法 [P] . 中国专利： CN103632348B . 2016.05.11
2. 一种点云曲面的复合几何图像表示方法 [P] . 中国专利： CN104484852A . 2015-04-01
3. Apparatus allowing the execution of traces of different shapes, geometric or not, in the shape and number almost endless, and their reproduction with an absolute precision at different scales of variable dimensions [P] . 法国专利： FR709451A . 1931-08-07

机译：一种设备，可以执行几乎无穷无尽的形状和数量不同的几何形状或几何形状的迹线，并且可以在不同尺寸的可变尺度上以绝对精度进行复制
4. A provision for the distribution of digital information of images and audio projection locations,An apparatus for transmitting data representing Images at selected locations, a device to display Images representing the data transmitted by that for [P] . AR015084A1 . 2001-04-11

机译：一种用于分配图像和音频投影位置的数字信息的设备。一种用于在选定位置传输表示图像的数据的设备，一种用于显示表示由该设备传输的数据的图像的设备
5. Method for representing images using quantized embeddings of scale-invariant image features [P] . 美国专利： US8891878B2 . 2014-11-18

机译：使用尺度不变图像特征的量化嵌入来表示图像的方法