法律状态公告日
法律状态信息
法律状态
2018-03-16
授权
授权
2015-03-11
实质审查的生效 IPC(主分类):G06K9/62 申请日:20141029
实质审查的生效
2015-02-04
公开
公开
技术领域
本发明属于图像处理技术领域,涉及图像分类领域的应用,具体的说是一种基于 RBM和SVM的极化SAR图像分类方法,可用于对极化SAR图像的地物分类和目标 识别。
背景技术
极化SAR是一种高分辨主动式相干多通道微波遥感成像雷达,它是SAR的一个 重要分支,具有全天候、全天时、分辨率高、可侧视成像等优点,可广泛应用于军事、 农业、导航、地理监视等诸多领域。极化SAR能够获得更加丰富的目标信息,在国 际遥感领域受到高度重视,因此极化SAR图像分类已成为极化SAR信息处理的一个 重要研究方向。
现有的极化SAR图像分类方法可以分为有监督分类和无监督分类。
有监督分类方法包括:Lee等提出的基于复Wishart分布的极化协方差矩阵监督 分类方法,由于极化协方差矩阵C可以通过线性变换得到极化相干矩阵T,这样就得 到Wishart分类器,这种方法要求C或T矩阵的概率密度分布函数服从复Wishart分布, 对数据分布要求严格;Heermann等提出的基于后向传播神经网络的极化SAR图像分 类方法,这种方法收敛速度慢,且容易陷入局部最优。
无监督分类方法包括:Cloude等提出的H/α非监督分类,它是通过Cloude目标 分解得到散射熵H和平均散射角α特征参数后,根据这两个参数的范围对目标进行八 分类,这种方法分类边界固定导致区域的划分过于武断,且只利用H和α这两个参数, 极化信息没有得到充分利用,导致分类准确度低;Lee等提出基于Cloude目标分解和 Wishart分类器的H/α-Wishart非监督分类方法,它是在原始H/α分类基础上增加 了Wishart迭代,弥补了H/α分类固定边界的缺陷,但这种方法不能很好的保持各类 的极化散射特性;Lee等基于Freeman分解提出了一种极化SAR图像分类方法,它主 要是根据Freeman分解获得平面散射功率、二面角散射功率和体散射功率的大小对极 化数据进行划分,并对初始划分进行类别合并,最后再利用Wishart分类器重新划分, 这种方法保持了各类的散射特性,但存在多类别的划分及合并,计算复杂度较高。
发明内容
本发明的目的在于针对已有技术的不足,提出一种基于RBM和SVM的极化SAR 图像分类方法,充分利用图像的空间相关性和极化信息,对原始特征空间重新学习, 提取更有效的特征进行分类,提高了分类精度。
为实现上述目的,本发明包括如下步骤:
步骤1,输入待分类的极化SAR图像,进行精致极化Lee滤波,去除斑点噪声, 得到滤波后的极化SAR图像;
步骤2,基于滤波后的极化SAR图像每个像素点的极化相干矩阵T和极化协方差 矩阵C,得到图像的原始特征空间;
步骤3,根据极化SAR图像的地物分布参考图中已标注的信息,随机选择每类的 训练样本,得到训练样本集合:
本发明中采样得到的每类样本数目为600个;
步骤4,初始化限制玻耳兹曼机(Restricted Boltzmann Machine,RBM)的相关 参数;
步骤5,将选取的训练样本分批次并归一化到[0.1,0.9]后训练RBM网络;
步骤6,重复步骤5,直至满足终止条件,本方法中选取的终止条件为达到最大 迭代次数200次,然后得到RBM的参数θ=(W,a,b)以及隐藏层的输出特征 p(h=1|v(0)):
其中,W是可见层与隐藏层之间的连接权重,a是可见层偏置,b是隐藏层偏 置,p(h=1|v(0))表示在已知可见层状态v(0)时采样出隐藏层各个单元状态h=1的概 率,并将此作为RBM的输出特征;
步骤7,将步骤6得到的隐藏层特征(即极化SAR图像训练样本的原始数据经 过RBM重新学习得到的隐藏层特征)以及训练样本标签去训练SVM分类器;
步骤8,利用训练好的SVM分类器预测分类:
将待分类的极化SAR图像原始的测试数据归一化到[0.1,0.9]后,输入训练好的 RBM,得到RBM隐藏层的特征,然后利用这些特征输入到训练好的SVM对待分类 的极化SAR图像进行分类,得到每个像素点的类别;
步骤9,输出图像并计算分类精度。
本发明首先对极化SAR图像滤波,减少噪声影响;其次,充分提取图像的原始 特征并进行归一化;然后,初始化并训练RBM网络,对图像的原始特征重新学习; 最后,利用RBM网络隐藏层输出的特征训练SVM分类器,并预测分类以及计算分 类精度。本发明与现有的技术相比具有以下优点:
1.本发明采用精致极化Lee滤波对极化相干矩阵和极化协方差矩阵中所有元素进 行相干斑抑制,减少噪声影响,同时避免了极化通道之间的串扰,又保持了极化通道 之间的极化信息和统计相关性;
2.本发明考虑到图像空间相关性,将邻域特征也作为中心像素的特征,不仅充分 利用了极化信息,而且能够自适应的将相似度高的分为一类,从而提高分类精度;
3.本发明采用新的特征学习方法—RBM,将极化SAR图像的原始特征重新进行 学习,分级抽象化,提取出更有利于极化SAR图像分类的特征;
4.本发明实现了在极化SAR图像原始特征的基础上,重新学习并提取新的特征, 再引入SVM分类器进行分类,实验结果表明这种策略得到了更好的分类结果,明显 地提高了分类精度。
附图说明
图1是本发明的总流程图;
图2是本发明仿真使用的一幅极化SAR图像;
图3是本发明仿真使用的极化SAR图像的地物分布参考图;
图4是对图2精致极化Lee滤波后,用现有的Wishart分类器的方法,利用训练 样本得到各类的聚类中心,再利用Wishart距离重新聚类得到的分类仿真结果图;
图5是对图2精致极化Lee滤波后,用现有的基于目标分解—Cloude分解和 Freeman分解提取特征,再利用SVM分类的方法得到的分类仿真结果图;
图6是本发明对图2的分类仿真结果图。
具体实施方式
参照图1,本发明的具体实现步骤如下:
步骤1,输入待分类的极化SAR图像,进行精致极化Lee滤波,去除斑点噪声, 得到滤波后的极化SAR图像。
优选地,采用如下步骤:
1a)边缘检测及方向窗口选取:在待分类的极化SAR分类图像的span总功率图像 (图像每一像素点的值等于该像素点的极化协方差矩阵对角线元素之和)上,设置滤 波窗口大小为7*7,按照像素空间位置,从左到右、从上到下将滤波窗口依次分解为 9个子窗口,其中子窗口大小为3*3,子窗口之间有重叠,计算每个子窗口的均值, 获得3*3大小的均值窗口;在均值窗口内,用4方向(水平,垂直,45度,135度) 边缘模板进行检测以确定边缘方向,即将均值窗口分别与4个模板进行加权,对得到 的加权结果求绝对值,选出所有绝对值中的最大值,将该最大值对应的方向作为边缘 方向;在3*3的均值窗口内,比较边缘方向两侧的像素元素与中心像素(位于3*3均 值窗口中心的那个像素)的邻近性,即均值窗口在边缘方向两侧的值减去中心像素的 值,选取结果绝对值最小的一侧作为方向窗口(即其滤波同质区);
1b)权值参数计算及滤波处理:在方向窗口内,采用下式:
计算精致极化Lee滤波的滤波系数b,(1)式中的y表示方向窗口内极化SAR总功率 图像的像素值,var(y)表示方向窗口内像素值的总功率方差,表示y的数学期望,σv表示相干斑噪声的标准差。由滤波系数b,根据下式
计算滤波后中心像素的极化相干矩阵或极化协方差矩阵(2)式中的表示方向窗口 内像素的极化相干矩阵或极化协方差矩阵的数学期望,Z表示中心像素的极化相干矩 阵或极化协方差矩阵。
步骤2,基于滤波后的极化SAR图像每个像素点的极化相干矩阵T和极化协方差 矩阵C,得到图像的原始特征空间。
2a)由于极化相干矩阵T和极化协方差矩阵C具有丰富的关于雷达目标的相位和 幅度信息,而且都是哈密顿半正定矩阵,所以可提取维数为3*3的极化相干矩阵T的 上三角位置的6个元素的模值,维数为3*3的极化协方差矩阵C的上三角位置的6个 元素的实部和虚部(对角线元素虚部为0,不包括在内),以及对角线元素之和得到功 率span;
2b)对极化相干矩阵T进行Cloude分解:
其中,TD=diag{λ1,λ2,λ3},λi(i=1,2,3)是极化相干矩阵的特征值,且λ1≥λ2≥λ3, U=[v1,v2,v3],vi是与λi相对应的单位特征矢量,()H表示这个矩阵的共轭转置;
接着,得到相应的特征:散射熵其中
平均散射角其中αi为散射体的内部自由度,
反熵A=(λ2-λ3)/(λ2+λ3),极化相干矩阵T的特征值λ1,λ2,λ3,继续作为每个 像素点的原始特征。基于上述特征提取方法,每个像素点共22维原始特征 [T11,T22,T33,abs(T12),abs(T13),abs(T23),C11,C22,C33,real(C12),imag(C12),real(C13),imag(C13), real(C23),imag(C23),span,H,α,A,λ1,λ2,λ3];
2c)考虑图像具有空间相关性,所以本方法将每个像素点的4邻域的每个像素点 的22维特征也都作为其特征,图像边界采用镜像对称进行填充,加上步骤2b)中得到 的22维原始特征,每个像素点共提取了110维的原始特征。
步骤3,根据极化SAR图像的地物分布参考图中已标注的信息,随机选择每类的 训练样本,得到训练样本集合。
本发明中采样得到的每类样本数目为600个。
步骤4,初始化限制玻耳兹曼机(Restricted Boltzmann Machine,RBM)的相关 参数。
优选地,采用如下步骤:
4a)为了并行运算和提高效率,一般将选取的训练样本分成包含10到100个样 本的小批量数据,然后逐个运算,本方法中每批次数据包含每类的5个训练样本数 据;设置可见层单元数目为极化SAR图像每个像素点原始特征的维数110,隐藏层 单元数目设置为30,即nv=110,nh=30;
4b)初始化相关参数:本方法中将可见层单元偏置和隐藏层单元偏置、可见层与 隐藏层之间的连接权重的学习率均设置为0.01,ηvb=ηhb=ηW=0.01;权重损失系数λ 设置为0.0002;初始动量学习率和最终动量学习率分别设置为0.5和0.9,即 ρini=0.5,ρfinal=0.9;k步对比散度(Contrastive Divergence,CD)算法中参数k=1;初 始化可见层与隐藏层的连接权重W是服从均值为0,标准差为0.1的正态分布的随机 数,隐藏层偏置b初始化为0,可见层偏置a初始化为[0,1]内的随机数,相应参数的 增量均设置为0,即ΔW(0)=Δa(0)=Δb(0)=0。
步骤5,将选取的训练样本分批次并归一化到[0.1,0.9]后训练RBM网络。
5a)对于每次迭代,在每小批量数据上,调用CD-k算法,进行k次交替Gibbs采 样,本方法只需1次交替Gibbs采样即可保证采集到的样本符合目标分布,具体为:
其中(3)式表示在已知可见层状态v(0)时采样出隐藏层的第j个单元的状态等 于1的概率,v(0)表示可见层的输入状态,即训练样本原始特征向量归一化后的数据, 表示可见层第i个单元的状态,表示隐藏层第j个单元的状态,bj表示隐藏层 第j个单元的偏置,wj,i表示可见层第i个单元与隐藏层第j个单元的连接权重;
接着,产生[0,1]内的随机数rj,对进行二值化,即:若则
其中(4)式表示在已知隐藏层状态时采样出可见层各个单元状态以此来代 替目标分布,其中ai表示可见层第i个单元的偏置;
利用(5)、(6)、(7)式分别计算每次迭代时目标函数在每小批量数据上关于连接权 重W、可见层偏置a、隐藏层偏置b的偏导数;
Δwi,j(iter)=ρ*Δwi,j(iter-1)+ηW*(Δwi,j(iter)/nblock-λ*wi,j(iter-1)) (8)
Δai(iter)=ρ*Δai(iter-1)+ηvb*(Δai(iter)/nblock) (9)
Δbi(iter)=ρ*Δbi(iter-1)+ηhb*(Δbi(iter)/nblock) (10)
本方法采用(8)、(9)、(10)式更新当前迭代(iter≥1)每小批量数据上的平均偏导数, 其中nblock为小批量数据的数目,ρ为动量学习率,本方法中,当每次迭代次数大于 30次时,ρ=ρfinal=0.9,否则,ρ=ρini=0.5;
5b)利用梯度上升法更新RBM参数θ=(W,a,b),具体为:
W(iter)=W(iter-1)+ΔW(iter)
a(iter)=a(iter-1)+Δa(iter) (11)
b(iter)=b(iter-1)+Δb(iter)
按上式更新当前迭代每小批量数据上的连接权重、可见层偏置和隐藏层偏置。
步骤6,重复步骤5,直至满足终止条件,本方法中选取的终止条件为达到最大 迭代次数200次,然后得到RBM的参数θ=(W,a,b)以及隐藏层的输出特征 p(h=1|v(0)):
其中,W是可见层与隐藏层之间的连接权重,a是可见层偏置,b是隐藏层偏 置,p(h=1|v(0))表示在已知可见层状态v(0)时采样出隐藏层各个单元状态h=1的概 率,并将此作为RBM的输出特征。
步骤7,将步骤6得到的隐藏层特征(即极化SAR图像训练样本的原始数据经 过RBM重新学习得到的隐藏层特征)以及训练样本标签去训练SVM分类器。
支持向量机(Support Vector Machine,SVM)是一种有效的监督分类器,根据间隔 最大化准则构造最优分类超平面进行分类,具有良好的泛化能力;
针对输入空间线性可分问题,SVM通过求解其对偶优化问题:
s.t.αi≥0
其中,αi是Lagrange乘子,xi,xj是训练样本数据,yi,yj是训练样本标签,m是 训练样本数目,<·,·>表示欧式内积;
求解出Lagrange乘子α,然后根据求解出超平面的法向量w,最 后在α和w以求解出的情况下,可通过求解出超平面的截距 b,其中T表示转置;
这样,最优分类超平面可表示为
该方法引入核函数可将输入空间中线性不可分的问题转化到高维空间,使其在 新空间中线性可分,典型的核函数包括多项式核函数、径向基核函数和S型核函数 等,本方法采用的核函数为径向基核函数;对于多类的分类问题,可以在2类问题 的基础上进行推广,其中具有代表性的2种算法为一对多算法和一对一算法,本方 法采用的分类算法为一对一算法。
步骤8,利用训练好的SVM分类器预测分类。
将待分类的极化SAR图像原始的测试数据归一化到[0.1,0.9]后,输入训练好的 RBM,得到RBM隐藏层的特征,然后利用这些特征输入到训练好的SVM对待分类 的极化SAR图像进行分类,得到每个像素点的类别。
步骤9,输出图像并计算分类精度。
9a)利用SVM预测分类的像素类别,将R(红色)、G(绿色)、B(蓝色)作为三基色, 按照三基色上色法进行上色,得到上色后的极化SAR图像,然后将其输出;
9b)将极化SAR图像得到的像素类别与真实地物类别进行比较,将类别一致的 像素个数与全部像素个数的比值作为极化SAR图像的分类精度。
本发明的效果可以通过下面的实验仿真进一步说明:
1、实验条件与方法
硬件平台为:Intel Core2 Duo CPU E8400@3.00GHZ、1.95GB RAM;
软件平台为:MATLAB R2009a;
实验方法:分别为本发明和现有的Wishart分类器的方法以及基于Cloude分解和 Freeman分解提取特征,再利用SVM分类的方法,其中现有的这两种方法都是极化 SAR图像分类中经典的方法。
2、仿真内容与结果
本发明和现有的Wishart分类器的方法以及基于Cloude分解和Freeman分解 提取特征,再利用SVM分类的方法分别对图2所示的Flevoland农田极化SAR图 像进行分类仿真,分类结果见图4到图6,其中,图4为Wishart分类器方法分类 结果图,图5为基于Cloude分解和Freeman分解提取特征,再利用SVM分类的 结果图,图6为本发明的分类结果图。
仿真实验中,根据图3所示的地物分布参考图,随机选取每类600个训练样 本,在剩下的样本上计算精度,应用各类分类精度和总分类精度作为评价指标。
评价结果如表1所示,其中,Alg1是Wishart分类器的方法,Alg2是基于Cloude 分解和Freeman分解提取特征,再利用SVM分类的方法,Alg3是本发明的方法。
表1.本发明和两种对比方法在仿真实验中得到的各类分类精度和总分类精度
3.实验结果分析
对比Wishart分类器方法得到的分类结果图4、基于Cloude分解和Freeman 分解提取特征,再利用SVM分类的方法得到的分类结果图5和本发明得到的分类 结果图6以及表1可以看出,图6所示的本发明相对于其他两种方法得到了更好 的实验结果,图6不仅杂散点少,而且保持了区域一致性与连贯性,每类分类精 度都高于两种对比方法,总分类精度明显地提高;图4所示的Wishart分类器方法 得到的分类结果虽然区域边缘划分相对平滑,但杂散点较多,而且有严重的错分 现象;图5所示的基于Cloude分解和Freeman分解提取特征,再利用SVM分类 的方法能够有效的正确分类,但是杂散点较多,丢失了图像的细节信息。
综上所述,本发明提出的基于RBM和SVM的极化SAR图像分类方法能够 明显地提高极化SAR图像分类精度,不仅有效的去除了噪声影响,保持了区域一 致性与连贯性,而且可用于对各种极化SAR图像分类。
机译: FPGA SVM安全系统用于挖掘机使用SVM和神经气相基于FPGA和FPGA
机译: 基于SVM-SOM组合的SVM-SOM DDoS检测系统及方法
机译: 基于SVM-SOM组合的SVM-SOM DDoS检测系统及方法