首页> 中国专利> 基于SSAE和FSALS-SVM极化SAR图像分类

基于SSAE和FSALS-SVM极化SAR图像分类

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明的目的是提供一种基于SSAE和FSALS-SVM的极化SAR图像分类方法。它利用栈式稀疏自动编码器(SSAE)的多隐层结构，获得具有对原始数据更本质的刻画能力并且更适合分类的深度特征，并用能够获得问题稀疏解的快速稀疏逼近最小二乘支持向量机(FSALS-SVM)代替传统深度学习中常用的Softmax，与SSAE相结合，提高了对极化SAR图像的分类精度，并在一定程度上克服了传统基于像素的极化SAR图像分类方法受相干斑噪声影响大的缺点，保证了分类结果图中匀质区域的连贯性。

著录项

公开/公告号CN104166859A

专利类型发明专利
公开/公告日2014-11-26

原文格式PDF
申请/专利权人西安电子科技大学;
展开▼

申请/专利号CN201410395368.2
发明设计人焦李成;刘芳;刘宸荣;马文萍;马晶晶;王爽;侯彪;李阳阳;
展开▼

申请日2014-08-13
分类号G06K9/62;
代理机构北京科亿知识产权代理事务所(普通合伙);
代理人汤东凤
地址 710071 陕西省西安市太白南路2号
入库时间 2023-12-17 01:49:17

法律信息

法律状态公告日

法律状态信息

法律状态
2017-09-22

授权

授权
2014-12-24

实质审查的生效 IPC(主分类):G06K9/62 申请日:20140813

实质审查的生效
2014-11-26

公开

公开

说明书

技术领域

本发明涉及图像处理领域，针对极化SAR图像分类问题，提出了一种基于栈式稀疏自动编码器(SSAE)和快速稀疏逼近最小二乘支持向量机(FSALS-SVM) 的极化SAR图像分类方法，可用于开展航空航天影像、天文学影像、军事等领域的数字图像预处理。

背景技术

合成孔径雷达(SAR)由于其全天时、全天候的工作能力，以及其分辨率高、能有效识别伪装和穿透掩盖物等特点而被广泛应用于遥感和地图测绘等领域。在近二十年来，极化SAR已被证明能够获得比传统的单极化SAR更加丰富的地物信息。目前，全球许多极化SAR系统，如TerraSAR-X、RADARSAT-2、 ALOS-PALSAR等，已经提供了大量的极化SAR数据以供研究。然而，对这些大规模、复杂的数据进行人为手动研究是不现实的。因此，对极化SAR数据进行全自动或半自动研究是迫切需要的，其中极化SAR图像分类是极化SAR信息处理的一个重要分支。

极化SAR图像分类作为极化SAR图像解译的重要步骤，许多学者都对其进行了深入的研究，所提出的方法大致可以分为以下三类：1、基于极化散射机制的分类方法，它的特点是利用不同类的先验知识对图像进行分类；2、基于极化 SAR图像统计特性的分类方法，以最大似然法和最大后验概率法为代表；3、基于二者结合的分类方法。然而，所有这些方法都可归结成基于像素的方法。基于像素的方法即：仅利用单个像素本身的特性对图像进行分类。这类方法在确定当前像素类别时，将每个像素都看成是独立的，不受周围像素的影响，能较好的保留图像细节。

发明内容

本发明的目的在于针对已有技术的不足，提出一种基于SSAE和FSALS-SVM 的极化SAR图像分类方法，以提高分类效果，使分类结果更吻合真实地物。

为实现上述目的，本发明包括如下步骤：

步骤1，对待输入的所有极化SAR图像数据进行预处理，获得无标记训练样本和带标记训练样本；

步骤2，将每个稀疏自动编码器(SAE)均作为构成栈式稀疏自动编码器 (SSAE)的一个基本单元，并将前一个SAE的输出作为后一个SAE的输入来逐个训练SAE，以获得每个SAE的模型参数，其中，步骤1中得到的所有无标记训练样本作为首个SAE的输入，优选地，本发明中的SAE个数为2；

步骤3，将步骤2中获得的多个SAE级联在一起构成SSAE，并将步骤1中得到的带标记训练样本输入该SSAE，进行前馈传导计算，获得这些带标记训练样本的深度特征；

步骤4，将深度特征进行归一化处理后，输入到快速稀疏逼近最小二乘支持向量机(FSALS-SVM)，通过迭代训练获得训练后的FSALS-SVM分类器；

步骤5，将预处理后的待分类极化SAR图像数据，即步骤1中得到的无标记训练样本，输入到栈式稀疏自动编码器，获得数据的深度特征，并将这些特征输入到训练后的FSALS-SVM分类器，获得图像的最终分类结果。

本发明与现有的技术相比具有以下优点：

1.本发明在获得图像分类特征时，利用了栈式稀疏自动编码器，输入仅为经过简单预处理后的原始极化SAR协方差数据，避免了传统在对极化SAR图像进行分类前，复杂的基于极化目标的特征分解过程；

2.由于栈式稀疏自动编码器具有多隐层的人工神经网络结构，它具有优异的特征学习能力，学习得到的特征对数据有更本质的刻画，从而有利于可视化和分类；

3.本发明用FSALS-SVM代替了传统深度学习常用的Softmax分类器，它能够获得问题的稀疏解，克服了LS-SVM因计算复杂度高而不利于大规模数据分类的缺点，降低了分类所耗的时间复杂度，与栈式稀疏自动编码器结合，提高了分类精度，并在一定程度上加强了分类结果中匀质区域的连贯性。

附图说明

图1是本发明的主流程图；

图2是本发明仿真使用的极化SAR数据的PauliRGB合成图；

图3是用现有基于SVM的分类方法对图2的分类结果图；

图4是用现有基于Wishart分布的分类方法对图2的分类结果图；

图5是用本发明对图2的分类结果图。

具体实施方式

参照图1，本发明的具体实现步骤如下：

步骤1，对待输入的所有极化SAR图像数据进行预处理，获得无标记训练样本和带标记训练样本。

(1a)对待输入的所有极化SAR图像数据进行滑窗大小为7×7的Lee滤波；

(1b)Lee滤波后的极化SAR图像的任一像素点n均可表示为一个3×3协方差矩阵M_n：

$M_{n} = (\begin{matrix} A & D + iE & F + iG \\ D - iE & B & H + iI \\ F - iG & H - iI & C \end{matrix})$

其中，n∈[1,2,…,N]，N为该极化SAR图像所包含的像素点个数，矩阵M_n中的大写字母A～I均为实数，可将这些字母组成列向量 t_n＝[A B C D E F G H I]^T，对每个像素点n所表示的列向量t_n依次排放，构成整个待分类样本集；

(1c)对(1b)中得到的待分类样本集进行简单地处理使其利于分类，在本发明中，优选地，根据极化SAR图像数据本身的特点，直接对该待分类样本集统一乘以一个较大的整数Q就可获得比较好的分类结果，优选地，Q＝500；

(1d)将(1c)中简单地处理后的待分类样本集中的所有样本均作为无标记训练样本，并根据真实地物类别，随机选取无标记样本中的一部分(优选地，2％) 进行标记，作为带标记训练样本。

步骤2，将每个稀疏自动编码器(SAE)均作为构成栈式稀疏自动编码器 (SSAE)的一个基本单元，并将前一个SAE的输出作为后一个SAE的输入来逐个训练SAE，以获得每个SAE的模型参数，其中，步骤1中得到的所有无标记训练样本作为首个SAE的输入，优选地，本发明中所需的SAE个数为两个。

具体实现步骤如下：

(2a)将步骤1中得到的所有无标记训练样本作为首个SAE的输入x，分别设置该SAE输入单元、隐藏单元和输出单元的个数。优选地，该SAE的输入单元和输出单元的个数均为9，隐藏单元的个数为50。

(2b)随机初始化模型参数W₁⁽¹⁾、W₁⁽²⁾、其中，W₁⁽¹⁾表示首个SAE 中输入单元和隐藏单元间的连接权重，W₁⁽²⁾表示首个SAE中隐藏单元和输出单元间的连接权重，表示首个SAE中隐藏单元的偏置项，表示首个SAE中输出单元的偏置项。计算隐藏单元和输出单元的激活值，并利用梯度下降法，最小化SSAE的整体代价函数J_sparse，从而获得训练后的模型参数具体实现步骤如下：

①随机初始化连接权重W₁⁽¹⁾、W₁⁽²⁾，使它们均为范围在内的数，偏置项为0，其中n_in表示当前SAE 中输入单元的个数，n_out表示当前SAE中输出单元的个数；

②利用如下前项传递函数F：

a^(l+1)＝F(W^(l)a^(l)+b^(l))

进行前馈传导计算，分别得到隐藏单元和输出单元的激活值a⁽²⁾、a⁽³⁾。其中，对任一SAE均有，l∈{1,2}即l可以取值1或2，a⁽¹⁾表示输入单元的激活值，a⁽²⁾表示隐藏单元的激活值，a⁽³⁾表示输出单元的激活值；

③定义SSAE的整体代价函数J_sparse：

$(\begin{matrix} J_{sparse} = [\frac{1}{m} Σ_{i = 1}^{m} (\frac{1}{2} {| | {\hat{y}}^{(i)} - y^{(i)} | |}^{2})] + \frac{λ}{2} {| | W | |}_{F}^{2} + \\ β Σ_{j = 1}^{s} [ρ \log \frac{ρ}{{\hat{ρ}}_{j}} + (1 - ρ) \log \frac{1 - ρ}{1 - {\hat{ρ}}_{j}}] \end{matrix})$

其中，第一项为均方差项，第二项为权重衰减项，其目的在于减小权重幅度防止过度拟合，第三项为稀疏性惩罚因子，用于将隐藏单元的平均活跃度保持在较小的范围内，W表示输入单元和隐藏单元之间的连接权重W^（1）与隐藏单元和输出单元之间的连接权重W⁽²⁾的转置的集合，即表示矩阵W⁽²⁾的转置，m表示输入SAE的样本个数，和y⁽ⁱ⁾分别表示输入第i个样本时得到的实际输出结果和理想输出结果，的上标2表示平方，表示实际输出结果与理想输出结果之间误差的平方，的上标2表示平方，下标F表示F范数，则表示W的F范数的平方，λ为权重衰减参数，β为控制稀疏性惩罚因子的权重，s为隐藏单元的个数，ρ为稀疏性参数，表示第j个隐藏单元的平均活跃度，它可由下式计算得到：

${\hat{ρ}}_{j} = \frac{1}{m} Σ_{i = 1}^{m} [a_{j}^{(2)} (x^{(i)})]$

其中，表示在输入第i个样本x⁽ⁱ⁾的时隐藏单元j的激活度，上标2表示隐藏单元。利用反向传波算法，计算整体代价函数J_sparse的梯度，优选地， ρ＝0.1、β＝3、λ＝0.003；

④通过梯度下降法求解代价函数J_sparse的最小化问题，从而获得训练后的模型参数

(2c)重新将步骤1中得到的所有无标记训练样本作为首个SAE的输入x，利用求得的模型参数可以计算出该SAE隐藏单元的激活值，并将该激活值作为第二个SAE的输入，设置该SAE输入单元、隐藏单元和输出单元的个数。优选地，该SAE的输入单元和输出单元的个数均为50，隐藏单元的个数为100；

(2d)按照步骤(2b)的方式对第二个SAE的输入进行训练，即可获得第二个 SAE训练后的模型参数下标2代表第二个SAE；

(2e)令r表示第r个SAE，若r小于所需SAE的个数R，则对于第r个SAE的模型参数W_r⁽¹⁾、W_r⁽²⁾、将第r-1个SAE中隐藏单元的激活值作为第 r个SAE的输入，并设置第r个SAE输入单元、隐藏单元和输出单元的个数，按照步骤(2b)的方式对第r个SAE的输入进行训练，即可获得第r个SAE训练后的模型参数否则(即r等于所需SAE的个数R)，停止训练。优选地， R＝2。

步骤3，将步骤2中获得的R个稀疏自动编码器(SAE)级联在一起，构成栈式稀疏自动编码器(SSAE)，并将步骤1中得到的带标记训练样本输入该SSAE，进行前馈传导计算，获得这些带标记训练样本的深度特征。

步骤4，将深度特征进行归一化处理后，输入到快速稀疏逼近最小二乘支持向量机(FSALS-SVM)，通过迭代训练获得训练后的FSALS-SVM分类器。

(4a)设置FSALS-SVM分类器中所用的核函数，该发明中，优选地，核函数为径向基函数；

(4b)计算步骤3中获得的这些带标记训练样本的深度特征的均值mean和方差std，并将这些深度特征的取值范围规整化为零均值和单位方差，得到归一化的深度特征；

(4c)将第k类(k≥1)训练样本标记为1，其余类别均标记为-1，变为第k类的二分类问题；

(4d)输入归一化的深度特征，并利用(4c)中得到的第k类的二分类问题训练 FSALS-SVM分类器，并在获得第k类参数后，令k的值加1；

(4e)若k大于训练样本类别数K，则停止训练，并将获得的第1类到第K类参数共K类参数依次排列后所构成的集合，作为训练后的FSALS-SVM分类器参数，获得训练后的FSALS-SVM分类器；否则(即k小于或等于训练样本类别数K)，重复步骤(4c)～(4e)，本发明的实施例中，根据真实地物的类别总数确定K＝9。

步骤5，将预处理后的待分类极化SAR图像数据，即步骤1中得到的无标记训练样本，输入到SSAE，获得这些无标记训练样本的深度特征，并将这些深度特征输入到训练后的FSALS-SVM分类器，获得图像的最终分类结果。

(5a)将步骤1中得到的无标记训练样本输入到SSAE，通过前馈传导计算，获得这些无标记训练样本的深度特征；

(5b)将(5a)中获得的深度特征的取值范围规整化为零均值和单位方差，得到归一化的深度特征；

优选地，利用步骤(4b)中得到的均值mean和方差std，将(5a)中获得的深度特征的取值范围规整化为零均值和单位方差，得到归一化的深度特征；

(5c)将归一化深度特征输入到训练后的FSALS-SVM分类器，获得最终分类结果。

本发明的效果可以通过以下实验仿真进一步说明：

1、实验条件与方法

硬件平台为：Intel Core2 Duo CPU E6550@2.33GHZ、2GBRAM；

软件平台为：MATLAB R2010a；

实验方法：分别为本发明和现有的基于SVM以及基于Wishart分布的极化 SAR图像分类方法，其中现有的这两种方法都是极化SAR图像分类中引用较多的经典方法。

2、仿真内容与结果

本发明将图2所示的荷兰Flevoland地区的地物分布情况作为测试图像，该图像来源于AIRSAR，大小为380×420。

仿真一，用现有的基于SVM的分类方法对图2进行分类，分类结果见图3。

由图3可见，地物类别虽然大致可以得到有效划分，但由于受相干斑噪声的影响，各个区域中均出现不同程度的混杂现象，特别是图3中圈出的区域错分现象严重。

仿真二，用现有的基于Wishart分布的分类方法对图2进行分类，分类结果见图4。

由图4可见，分类效果与图3相比，类别区分更合理，特别是图4中黑色圈包含的区域分类更加清晰，但白色圈包含的区域仍存在较严重的错分现象。

仿真三，用本发明对图2进行分类，分类结果见图5。

由图5可见，与图3和图4相比，本发明得到的分类结果不仅保持了图4中黑色圈包含的区域分类清晰的优势，同时还大大减少了其他区域中错分的情况，特别是图5中白色圈包含的区域相比图3和图4中的相应区域来说，错分情况明显减少。

综上所述，本发明的方法在极化SAR图像的有监督分类问题上能取得更好的分类结果，它在一定程度上保证了均质区域的连贯性，使分类结果更好地吻合真实地物。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 基于SSAE和FSALS-SVM极化SAR图像分类 [P] . 中国专利： CN104166859A . 2014-11-26
2. 基于SSAE和FSALS‑SVM极化SAR图像分类 [P] . 中国专利： CN104166859B . 2017.09.22
3. METHOD FOR MONITORING TOOL WEAR IN DEEP HOLE MACHINING BASED ON SSAE-LSTM MODEL [P] . WO2021046737A1 . 2021-03-18

机译：基于SSAE-LSTM模型的深孔加工刀具磨损的方法
4. Computer Program for Providing Endoscopic Image Information Analysis Service Based on Image Classification and Segmentation Integrated Learning Model [P] . KR20210110435A . 2021-09-08

机译：基于图像分类和分割综合学习模型的基于图像分类提供内窥镜图像信息分析服务的计算机程序
5. IMAGE CLASSIFICATION METHOD BASED ON DEEP LEARNING, IMAGE CLASSIFICATION APPARATUS, SERVER AND MEDIUM [P] . WO2021189908A1 . 2021-09-30

机译：基于深度学习，图像分类装置，服务器和媒体的图像分类方法