首页> 中国专利> 基于特征池化与除归一化表示的高分辨率遥感图像分类方法

基于特征池化与除归一化表示的高分辨率遥感图像分类方法

摘要

一种基于特征池化与除归一化的遥感图像分类方法,首先对遥感图像进行线性滤波,采用特征池化对线性滤波结果的特征进行合并,而后通过除归一化降低遥感图像中的高阶相关性,以稠密网格方式提取局部描述子,最后经Hellinger核映射与特征降维后进行特征编码形成遥感图像的全局表达,再经训练与预测后完成对遥感图像的分类,本发明能够获得较高的图像分类精度,消除了图像中的低阶高阶统计相关性的冗余增强目标位置不变性,特征压缩紧凑,降低了特征维度,提高了计算效率,获得了更好的分类性能,简单易实现,精度高。

著录项

  • 公开/公告号CN106845417A

    专利类型发明专利

  • 公开/公告日2017-06-13

    原文格式PDF

  • 申请/专利权人 上海交通大学;

    申请/专利号CN201710052019.4

  • 发明设计人 方涛;万里红;

    申请日2017-01-20

  • 分类号G06K9/00;G06K9/62;

  • 代理机构上海交达专利事务所;

  • 代理人王毓理

  • 地址 200240 上海市闵行区东川路800号

  • 入库时间 2023-06-19 02:31:39

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-11-08

    授权

    授权

  • 2017-07-07

    实质审查的生效 IPC(主分类):G06K9/00 申请日:20170120

    实质审查的生效

  • 2017-06-13

    公开

    公开

说明书

技术领域

本发明涉及的是一种遥感图像处理领域的技术,具体是一种基于特征池化与除归一化的遥感图像分类方法。

背景技术

高分辨率的遥感图像分类中的一个关键步骤为提取合适的图像特征,广泛采用的特征有纹理特征和局部特征。常见的纹理特征有Gabor纹理和LBP纹理,局部特征有HOG特征、SIFT特征以及Dense SIFT特征等。但图像分类中存在目标尺度、光照不一致,目标遮挡,低阶与高阶相关性等问题。

现有的基于视觉词汇的遥感图像地物分类方法,大多基于高斯模糊与抽样生成多层高斯空间金字塔;再通过SIFT特征提取与LBP特征提取,并使用支持向量机RBF-SVM进行训练,从而对测试集中遥感图像进行地物分类。但基于视觉词汇的图像分类方法在本质上都受限于词包模型的缺点。第一,采用频率直方图特征的方式并不是最优的图像表示。第二,词包模型对低层次描述子(如SIFT特征)的量化是一个有损过程。另外,径向基核的RBF-SVM在训练时需要进行参数寻优,这样会使得训练耗时较高,并且,训练好的RBF-SVM分类器对测试图像进行分类时也同样是耗时的。

现有技术中也有通过预训练的开源深度学习框架ConvNet并结合SVM分类器,评价了深度特征的泛化能力,在遥感图像分类中同样获得了较高的分类精度。但这类技术中的卷积神经网络中包含许多卷积层的特征提取,并且每一层都涉及到大量滤波器核的卷积操作,当进一步考虑将多个卷积神经网络组合在一起时,随着组合数量的增加,其计算复杂度会成倍地增加。

发明内容

本发明针对现有技术存在的上述不足,提出一种基于特征池化与除归一化的遥感图像分类方法,能够获得较高的图像分类精度,消除了图像中的低阶高阶统计相关性的冗余增强目标位置不变性,特征压缩紧凑,降低了特征维度,提高了计算效率。获得了更好的分类性能,简单易实现,精度高。

本发明首先对遥感图像进行线性滤波,采用特征池化对线性滤波结果的特征进行合并,而后通过除归一化降低遥感图像中的高阶相关性,以稠密网格方式提取局部描述子,最后经Hellinger核映射与特征降维后进行特征编码形成遥感图像的全局表达,再经训练与预测后完成对遥感图像的分类。

本发明包括以下步骤:

1)分别采用Log-Gabor滤波和高斯导数滤波结合方向化幅值的方式得到相应的滤波响应;

2)采用特征池化对得到的滤波响应进行空间上相邻位置合并;

3)对每一空间位置,将其与周围相邻位置进行除归一化,并以稠密网格方式提取局部描述子;

4)对局部描述子进行Hellinger核映射与特征降维后再进行特征融合,之后通过特征编码将融合后的局部特征描述子聚合成图像形成全局表达;

5)结合线性分类器对聚合的图像进行学习与预测,实现分类。

所述的Log-Gabor滤波采用三个尺度与四个方向,共组成12个滤波器,对输入图像进行线性滤波后,最后形成12幅Log-Gabor幅值图。

所述的高斯导数滤波采用水平、垂直两个方向对遥感图像进行滤波,并计算两个方向上的梯度响应和梯度方向。

所述的方向化幅值指根据梯度方向将每个空间位置的梯度响应离散化,得到若干具有方向性的梯度幅值图。

所述的步骤2)具体包括以下步骤:

2.1)对Log-Gabor幅值图和梯度幅值图进行不重叠的局部块划分;

2.2)每一局部块采用特征池化对特征进行合并。

所述的特征池化,即大脑皮层一种简单的神经计算操作,具体是指:在特征提取中,用于对局部邻域输入进行图像变换,取得某种不变的、更加紧凑的与稳健的特征表达,最常用的特征池化有平均池化和最大池化。对pSz×pSz像素大小(对应pSz×pSz维特征)的局部图像块区域,用一维特征来表示该图像块,即将pSz×pSz维特征降维至一维。平均池化与最大池化分别是将pSz×pSz个特征值的平均值与最大值作为最终的一维特征。

所述的局部特征描述子为分歧归一化因子(Divisive Normalization Features,DNF),通过线性滤波、特征池化、除归一化、稠密提取与融合四个阶段实现DNF的提取,其中:线性滤波消除了图像中的低阶相关;特征池化完成对滤波特征的紧凑表达与一定程度上的平移不变性;除归一化进一步降低特征之间的高阶相关性;稠密提取与融合分别进行局部描述子DNF的提取与增强表达。

所述的线性分类器优选采用线性SVM。

附图说明

图1为本发明流程示意图;

图2为特征提取过程示意图;

图3为特征编码过程示意图;

图4为Land Use数据集;

图5为Land Use混淆矩阵。

具体实施方式

如图1所示,首先对遥感图像进行线性滤波,采用特征池化对线性滤波结果的特征进行合并,而后通过除归一化降低遥感图像中的高阶相关性,以稠密网格方式提取局部描述子,最后经Hellinger核映射与特征降维后进行特征编码形成遥感图像的全局表达,再经训练与预测后完成对遥感图像的分类。具体包括以下步骤:

1)分别采用Log-Gabor滤波和高斯导数滤波结合方向化幅值的方式得到相应的滤波响应。

所述的Log-Gabor滤波包括两个部分的乘积,构成Log-Gabor滤波器。这两个部分分别为径向滤波器G(ρ)和方向滤波器G(θ),则其中:滤波器中心频率ρ0=1/λ,Log-Gabor尺度的波长λ=λ0ms-1,λ0为最小Log-Gabor尺度的波长,m为相邻尺度间的比例因子,s=1,2,…,ns,ns表示尺度的数量,σρ决定尺度带宽。θ0=π(n-1)/no表示滤波器的方向角度,n=1,2,…,no,no表示方向的数量,σθ决定角度带宽。设定λ0=3,m=2,σρ=0.65,σθ=π/12。

所述的Log-Gabor滤波器通过ns和no来构造,为三个尺度四个方向的滤波器,即ns=3、no=4。

如图2所示,对输入的灰度图像I进行Log-Gabor滤波获得滤波响应幅值图L:Li=abs(ifft2(Fi.*fft2(I))),i=1,2,…,3×4,其中:.*表示点乘,Fi表示傅里叶空间中特定方向与尺度的滤波器,fft2表示二维快速傅里叶变换,ifft2表示fft2的逆变换,abs表示绝对值操作,Li表示滤波输出。

所述的高斯导数滤波采用水平与垂直两个方向的高斯导数滤波器,并计算两个方向上的梯度响应和梯度方向。所述的方向化幅值指根据梯度方向将每个空间位置的梯度响应离散化,得到若干具有方向性的梯度幅值图。将输入的灰度图像I进行两个方向上的梯度特征提取。设H(x,y)与V(x,y)分别表示图像I在(x,y)位置上的水平与垂直方向的梯度值,可以获得归一化的幅值M与方向A,其中:

所述的方向A(x,y)值离散化到nBin个方向中,具体离散化的方向则由决定。最后,M可映射出nBin幅方向化的梯度幅值图G:Gi,i=1,2,…,nBin。为了获得与Log-Gabor幅值图数量相同的滤波图,nBin设为12。

2)采用特征池化对得到的滤波响应进行空间上相邻位置合并。

2.1)对Log-Gabor幅值图和梯度幅值图进行不重叠的局部块划分。将Log-Gabor幅值图和梯度幅值图划分为不重叠的局部块即图像块。假定图像块Pj,包含pSz×pSz个像素,表示任意一幅图中的第j块,通过特征池化之后,Pj将由一个特征值来表示。

2.2)每一个pSz×pSz像素的局部图像块采用特征池化操作对线性滤波响应幅值进行空间上相邻位置的合并。所述的特征池化表达式为:

所述的特征池化为:对pSz×pSz像素大小(对应pSz×pSz维特征)的局部图像块区域,用一维特征来表示该图像块,即将pSz×pSz维特征降维至一维。特征池化可分为平均池化和最大池化。平均池化是将pSz×pSz个特征值的平均值作为最终的一维特征。最大池化则是采用pSz×pSz个特征值的最大值作为最终的一维特征。

3)对每一空间位置,将其与周围相邻位置进行除归一化,并以稠密网格方式提取局部描述子。

所述的除归一化是指:对经过池化后所得的池化特征图(图2),设定一个wSz×wSz大小的除归一化窗口(图2中虚线窗口),将窗口中心位置的池化特征值与此窗口内周围其它位置的池化特征值的累积和进行除操作,设定除归一化窗口的滑动步长为1,完成对池化特征图中所有空间位置的除归一化操作。

所述的局部描述子为Divisive Normalization Features(DNF),DNF的提取经过了线性滤波、特征池化、除归一化、稠密提取与融合四个阶段。

所述的除归一化具体公式为其中:γ表示总体响应,β决定基本响应,σ防止分母除零,m、p、q表示单个输入的放大指数。表示第j块和第k块的特征池化。window表示除归一化的窗口区域大小,窗口包含邻近的wSz×wSz块,Rj表示除归一化结果。γ=1,β=0,σ=0.001,m=1,p=2,q=0.5。因此,对每一幅值图,通过滑动除归一化窗口的方式,可获得所有位置的除归一化值。

如图2所示,采用稠密网格为4×4,滑动步长为1,稠密地提取DNF描述子,每一个DNF描述子为16维的特征向量。对两种线性滤波,分别组合在相同空间位置提取的16维特征向量,比如Log-Gabor有12幅滤波图,则提取一系列12×16=192维的局部描述子。高斯导数滤波的局部描述子提取方式也与Log-Gabor类似,同样为192维。

4)对局部描述子进行Hellinger核映射与特征降维后再进行特征融合,之后通过特征编码将融合后的局部特征描述子聚合成图像形成全局表达。

如图3所示,所述的Hellinger核映射采用L1归一化局部描述子向量。对局部描述子向量的每个特征值开平方根。而后,对主成分降维即特征降维,降维的子空间学习过程则是从训练样本中随机选取一定数量的描述子,如500000,学习得到。最后,将两种线性滤波情况下相同空间位置的局部描述子进行特征融合。

所述的Hellinger核映射是一种非线性特征映射方法(图3),包含了两个步骤:第一,对描述子(特征向量)进行L1归一化;第二,对L1归一化后的特征向量中的每一个特征值进行开平方根操作。

5)结合线性分类器对聚合的图像进行学习与预测,实现分类。

如图3所示,采用高斯混合模型(GMM)学习到步骤4)中所提取的局部描述子的分布,即聚类中心。利用Fisher vector特征将局部描述子聚合成图像全局表达的特征向量。采用线性SVM完成对Fisher vector特征向量的学习与预测,实现分类。

如图4所示,采用被广泛使用的公开数据集土地利用(Land Use),其为美国许多不同的区域的遥感图像,共包含2100幅21类256×256像素的RGB彩色图像,每一类均包含100幅。图4中,编号从1至21分别表示为:农用地(agricultural)、机场(airplane)、棒球场(baseball diamond)、沙滩(beach)、建筑(buildings)、灌木丛(chaparral)、密集住宅区(dense residential)、森林(forest)、高速公路(freeway)、高尔夫球场(golf course)、港口(harbor)、交叉口(intersection)、中等密集住宅区(medium density residential)、活动房区(mobile home park)、立交桥(overpass)、停车场(parking lot)、河流(river)、跑道(runway)、稀疏住宅区(sparse residential)、储油罐(storage tanks)、网球场(tenniscourts)。

试验时,首先进行彩色图像灰度化处理。为了提取充足数量的局部描述子,对原始图像进行图像金字塔构造,采用比例值为1.5的下采样方式,将原始图像构建成包含4幅不同尺度的图像金字塔,对金字塔中的每一层图像都分别按照本方法的步骤单独进行的特征提取。

所述的pSz=8与wSz=20,对局部描述子向量降维至64维,特征编码中的GMM聚类数采用96,实验结果如表1。可以看出,本实施例的方法在每类训练样本为80的时候,可获得93.78%的分类精度。本方法的特征提取过程具有简单易实现的优点,并且分类精度高具有可比性,更具实用价值。

表1Land Use数据集分类精度对比

如图5所示,本方法在一些类别上可以获得非常高的分类精度,如农用地为99.00%,机场为98.00%,沙滩为100%,灌木丛为98.00%,森林为98.50%,港口为100%,立交桥为99.50%,跑道为98.5%。上述这些类别都具有较为明显的纹理特征与空间结构,其中某些类别内也包含了一些特定目标或场景。

与现有技术相比,本方法能够获得较高的图像分类精度,消除了图像中的低阶高阶统计相关性的冗余增强目标位置不变性,特征压缩紧凑,降低了特征维度,提高了计算效率。获得了更好的分类性能,简单易实现,精度高。

上述具体实施可由本领域技术人员在不背离本发明原理和宗旨的前提下以不同的方式对其进行局部调整,本发明的保护范围以权利要求书为准且不由上述具体实施所限,在其范围内的各个实现方案均受本发明之约束。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号