首页> 中国专利> 基于SSAE和FSALS-SVM极化SAR图像分类

基于SSAE和FSALS-SVM极化SAR图像分类

摘要

本发明的目的是提供一种基于SSAE和FSALS-SVM的极化SAR图像分类方法。它利用栈式稀疏自动编码器(SSAE)的多隐层结构,获得具有对原始数据更本质的刻画能力并且更适合分类的深度特征,并用能够获得问题稀疏解的快速稀疏逼近最小二乘支持向量机(FSALS-SVM)代替传统深度学习中常用的Softmax,与SSAE相结合,提高了对极化SAR图像的分类精度,并在一定程度上克服了传统基于像素的极化SAR图像分类方法受相干斑噪声影响大的缺点,保证了分类结果图中匀质区域的连贯性。

著录项

  • 公开/公告号CN104166859A

    专利类型发明专利

  • 公开/公告日2014-11-26

    原文格式PDF

  • 申请/专利权人 西安电子科技大学;

    申请/专利号CN201410395368.2

  • 申请日2014-08-13

  • 分类号G06K9/62;

  • 代理机构北京科亿知识产权代理事务所(普通合伙);

  • 代理人汤东凤

  • 地址 710071 陕西省西安市太白南路2号

  • 入库时间 2023-12-17 01:49:17

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-09-22

    授权

    授权

  • 2014-12-24

    实质审查的生效 IPC(主分类):G06K9/62 申请日:20140813

    实质审查的生效

  • 2014-11-26

    公开

    公开

说明书

技术领域

本发明涉及图像处理领域,针对极化SAR图像分类问题,提出了一种基于栈 式稀疏自动编码器(SSAE)和快速稀疏逼近最小二乘支持向量机(FSALS-SVM) 的极化SAR图像分类方法,可用于开展航空航天影像、天文学影像、军事等领 域的数字图像预处理。

背景技术

合成孔径雷达(SAR)由于其全天时、全天候的工作能力,以及其分辨率高、 能有效识别伪装和穿透掩盖物等特点而被广泛应用于遥感和地图测绘等领域。在 近二十年来,极化SAR已被证明能够获得比传统的单极化SAR更加丰富的地物 信息。目前,全球许多极化SAR系统,如TerraSAR-X、RADARSAT-2、 ALOS-PALSAR等,已经提供了大量的极化SAR数据以供研究。然而,对这些 大规模、复杂的数据进行人为手动研究是不现实的。因此,对极化SAR数据进 行全自动或半自动研究是迫切需要的,其中极化SAR图像分类是极化SAR信息 处理的一个重要分支。

极化SAR图像分类作为极化SAR图像解译的重要步骤,许多学者都对其进 行了深入的研究,所提出的方法大致可以分为以下三类:1、基于极化散射机制 的分类方法,它的特点是利用不同类的先验知识对图像进行分类;2、基于极化 SAR图像统计特性的分类方法,以最大似然法和最大后验概率法为代表;3、基 于二者结合的分类方法。然而,所有这些方法都可归结成基于像素的方法。基于 像素的方法即:仅利用单个像素本身的特性对图像进行分类。这类方法在确定当 前像素类别时,将每个像素都看成是独立的,不受周围像素的影响,能较好的保 留图像细节。

发明内容

本发明的目的在于针对已有技术的不足,提出一种基于SSAE和FSALS-SVM 的极化SAR图像分类方法,以提高分类效果,使分类结果更吻合真实地物。

为实现上述目的,本发明包括如下步骤:

步骤1,对待输入的所有极化SAR图像数据进行预处理,获得无标记训练样 本和带标记训练样本;

步骤2,将每个稀疏自动编码器(SAE)均作为构成栈式稀疏自动编码器 (SSAE)的一个基本单元,并将前一个SAE的输出作为后一个SAE的输入来 逐个训练SAE,以获得每个SAE的模型参数,其中,步骤1中得到的所有无标 记训练样本作为首个SAE的输入,优选地,本发明中的SAE个数为2;

步骤3,将步骤2中获得的多个SAE级联在一起构成SSAE,并将步骤1中 得到的带标记训练样本输入该SSAE,进行前馈传导计算,获得这些带标记训练 样本的深度特征;

步骤4,将深度特征进行归一化处理后,输入到快速稀疏逼近最小二乘支持 向量机(FSALS-SVM),通过迭代训练获得训练后的FSALS-SVM分类器;

步骤5,将预处理后的待分类极化SAR图像数据,即步骤1中得到的无标记 训练样本,输入到栈式稀疏自动编码器,获得数据的深度特征,并将这些特征输 入到训练后的FSALS-SVM分类器,获得图像的最终分类结果。

本发明与现有的技术相比具有以下优点:

1.本发明在获得图像分类特征时,利用了栈式稀疏自动编码器,输入仅为经 过简单预处理后的原始极化SAR协方差数据,避免了传统在对极化SAR图像进 行分类前,复杂的基于极化目标的特征分解过程;

2.由于栈式稀疏自动编码器具有多隐层的人工神经网络结构,它具有优异的 特征学习能力,学习得到的特征对数据有更本质的刻画,从而有利于可视化和分 类;

3.本发明用FSALS-SVM代替了传统深度学习常用的Softmax分类器,它能 够获得问题的稀疏解,克服了LS-SVM因计算复杂度高而不利于大规模数据分 类的缺点,降低了分类所耗的时间复杂度,与栈式稀疏自动编码器结合,提高了 分类精度,并在一定程度上加强了分类结果中匀质区域的连贯性。

附图说明

图1是本发明的主流程图;

图2是本发明仿真使用的极化SAR数据的PauliRGB合成图;

图3是用现有基于SVM的分类方法对图2的分类结果图;

图4是用现有基于Wishart分布的分类方法对图2的分类结果图;

图5是用本发明对图2的分类结果图。

具体实施方式

参照图1,本发明的具体实现步骤如下:

步骤1,对待输入的所有极化SAR图像数据进行预处理,获得无标记训练样 本和带标记训练样本。

(1a)对待输入的所有极化SAR图像数据进行滑窗大小为7×7的Lee滤波;

(1b)Lee滤波后的极化SAR图像的任一像素点n均可表示为一个3×3协方差 矩阵Mn

Mn=AD+iEF+iGD-iEBH+iIF-iGH-iIC

其中,n∈[1,2,…,N],N为该极化SAR图像所包含的像素点个数,矩阵Mn中的 大写字母A~I均为实数,可将这些字母组成列向量 tn=[A B C D E F G H I]T,对每个像素点n所表示的列向量tn依次排 放,构成整个待分类样本集;

(1c)对(1b)中得到的待分类样本集进行简单地处理使其利于分类,在本发明 中,优选地,根据极化SAR图像数据本身的特点,直接对该待分类样本集统一 乘以一个较大的整数Q就可获得比较好的分类结果,优选地,Q=500;

(1d)将(1c)中简单地处理后的待分类样本集中的所有样本均作为无标记训 练样本,并根据真实地物类别,随机选取无标记样本中的一部分(优选地,2%) 进行标记,作为带标记训练样本。

步骤2,将每个稀疏自动编码器(SAE)均作为构成栈式稀疏自动编码器 (SSAE)的一个基本单元,并将前一个SAE的输出作为后一个SAE的输入来 逐个训练SAE,以获得每个SAE的模型参数,其中,步骤1中得到的所有无标 记训练样本作为首个SAE的输入,优选地,本发明中所需的SAE个数为两个。

具体实现步骤如下:

(2a)将步骤1中得到的所有无标记训练样本作为首个SAE的输入x,分别设 置该SAE输入单元、隐藏单元和输出单元的个数。优选地,该SAE的输入单元 和输出单元的个数均为9,隐藏单元的个数为50。

(2b)随机初始化模型参数W1(1)、W1(2)、其中,W1(1)表示首个SAE 中输入单元和隐藏单元间的连接权重,W1(2)表示首个SAE中隐藏单元和输出单 元间的连接权重,表示首个SAE中隐藏单元的偏置项,表示首个SAE中 输出单元的偏置项。计算隐藏单元和输出单元的激活值,并利用梯度下降法,最 小化SSAE的整体代价函数Jsparse,从而获得训练后的模型参数具 体实现步骤如下:

①随机初始化连接权重W1(1)、W1(2),使它们均为范围在 内的数,偏置项为0,其中nin表示当前SAE 中输入单元的个数,nout表示当前SAE中输出单元的个数;

②利用如下前项传递函数F:

a(l+1)=F(W(l)a(l)+b(l))

进行前馈传导计算,分别得到隐藏单元和输出单元的激活值a(2)、a(3)。其中, 对任一SAE均有,l∈{1,2}即l可以取值1或2,a(1)表示输入单元的激活值,a(2)表 示隐藏单元的激活值,a(3)表示输出单元的激活值;

③定义SSAE的整体代价函数Jsparse

Jsparse=[1mΣi=1m(12||y^(i)-y(i)||2)]+λ2||W||F2+βΣj=1s[ρlogρρ^j+(1-ρ)log1-ρ1-ρ^j]

其中,第一项为均方差项,第二项为权重衰减项, 其目的在于减小权重幅度防止过度拟合,第三项为稀疏性惩罚因子,用于将隐藏单元的平均活跃度保持在较小的范围 内,W表示输入单元和隐藏单元之间的连接权重W(1)与隐藏单元和输出单元之间 的连接权重W(2)的转置的集合,即表示矩阵W(2)的转 置,m表示输入SAE的样本个数,和y(i)分别表示输入第i个样本时得到的实 际输出结果和理想输出结果,的上标2表示平方,表 示实际输出结果与理想输出结果之间误差的平方,的上标2表示平方,下 标F表示F范数,则表示W的F范数的平方,λ为权重衰减参数,β为控制稀 疏性惩罚因子的权重,s为隐藏单元的个数,ρ为稀疏性参数,表示第j个隐藏 单元的平均活跃度,它可由下式计算得到:

ρ^j=1mΣi=1m[aj(2)(x(i))]

其中,表示在输入第i个样本x(i)的时隐藏单元j的激活度,上标2表示 隐藏单元。利用反向传波算法,计算整体代价函数Jsparse的梯度,优选地, ρ=0.1、β=3、λ=0.003;

④通过梯度下降法求解代价函数Jsparse的最小化问题,从而获得训练后的 模型参数

(2c)重新将步骤1中得到的所有无标记训练样本作为首个SAE的输入x,利 用求得的模型参数可以计算出该SAE隐藏单元的激活值,并将该 激活值作为第二个SAE的输入,设置该SAE输入单元、隐藏单元和输出单元的 个数。优选地,该SAE的输入单元和输出单元的个数均为50,隐藏单元的个数 为100;

(2d)按照步骤(2b)的方式对第二个SAE的输入进行训练,即可获得第二个 SAE训练后的模型参数下标2代表第二个SAE;

(2e)令r表示第r个SAE,若r小于所需SAE的个数R,则对于第r个SAE的 模型参数Wr(1)、Wr(2)、将第r-1个SAE中隐藏单元的激活值作为第 r个SAE的输入,并设置第r个SAE输入单元、隐藏单元和输出单元的个数,按 照步骤(2b)的方式对第r个SAE的输入进行训练,即可获得第r个SAE训练后的 模型参数否则(即r等于所需SAE的个数R),停止训练。优选地, R=2。

步骤3,将步骤2中获得的R个稀疏自动编码器(SAE)级联在一起,构成 栈式稀疏自动编码器(SSAE),并将步骤1中得到的带标记训练样本输入该SSAE, 进行前馈传导计算,获得这些带标记训练样本的深度特征。

步骤4,将深度特征进行归一化处理后,输入到快速稀疏逼近最小二乘支持 向量机(FSALS-SVM),通过迭代训练获得训练后的FSALS-SVM分类器。

(4a)设置FSALS-SVM分类器中所用的核函数,该发明中,优选地,核函数 为径向基函数;

(4b)计算步骤3中获得的这些带标记训练样本的深度特征的均值mean和方 差std,并将这些深度特征的取值范围规整化为零均值和单位方差,得到归一化 的深度特征;

(4c)将第k类(k≥1)训练样本标记为1,其余类别均标记为-1,变为第k类 的二分类问题;

(4d)输入归一化的深度特征,并利用(4c)中得到的第k类的二分类问题训练 FSALS-SVM分类器,并在获得第k类参数后,令k的值加1;

(4e)若k大于训练样本类别数K,则停止训练,并将获得的第1类到第K类参 数共K类参数依次排列后所构成的集合,作为训练后的FSALS-SVM分类器参数, 获得训练后的FSALS-SVM分类器;否则(即k小于或等于训练样本类别数K), 重复步骤(4c)~(4e),本发明的实施例中,根据真实地物的类别总数确定K=9。

步骤5,将预处理后的待分类极化SAR图像数据,即步骤1中得到的无标记 训练样本,输入到SSAE,获得这些无标记训练样本的深度特征,并将这些深度 特征输入到训练后的FSALS-SVM分类器,获得图像的最终分类结果。

(5a)将步骤1中得到的无标记训练样本输入到SSAE,通过前馈传导计算, 获得这些无标记训练样本的深度特征;

(5b)将(5a)中获得的深度特征的取值范围规整化为零均值和单位方差,得到 归一化的深度特征;

优选地,利用步骤(4b)中得到的均值mean和方差std,将(5a)中获得的深度特 征的取值范围规整化为零均值和单位方差,得到归一化的深度特征;

(5c)将归一化深度特征输入到训练后的FSALS-SVM分类器,获得最终分类 结果。

本发明的效果可以通过以下实验仿真进一步说明:

1、实验条件与方法

硬件平台为:Intel Core2 Duo CPU E6550@2.33GHZ、2GBRAM;

软件平台为:MATLAB R2010a;

实验方法:分别为本发明和现有的基于SVM以及基于Wishart分布的极化 SAR图像分类方法,其中现有的这两种方法都是极化SAR图像分类中引用较多 的经典方法。

2、仿真内容与结果

本发明将图2所示的荷兰Flevoland地区的地物分布情况作为测试图像,该 图像来源于AIRSAR,大小为380×420。

仿真一,用现有的基于SVM的分类方法对图2进行分类,分类结果见图3。

由图3可见,地物类别虽然大致可以得到有效划分,但由于受相干斑噪声的 影响,各个区域中均出现不同程度的混杂现象,特别是图3中圈出的区域错分现 象严重。

仿真二,用现有的基于Wishart分布的分类方法对图2进行分类,分类结果 见图4。

由图4可见,分类效果与图3相比,类别区分更合理,特别是图4中黑色圈 包含的区域分类更加清晰,但白色圈包含的区域仍存在较严重的错分现象。

仿真三,用本发明对图2进行分类,分类结果见图5。

由图5可见,与图3和图4相比,本发明得到的分类结果不仅保持了图4中 黑色圈包含的区域分类清晰的优势,同时还大大减少了其他区域中错分的情况, 特别是图5中白色圈包含的区域相比图3和图4中的相应区域来说,错分情况明 显减少。

综上所述,本发明的方法在极化SAR图像的有监督分类问题上能取得更好 的分类结果,它在一定程度上保证了均质区域的连贯性,使分类结果更好地吻合 真实地物。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号