法律状态公告日
法律状态信息
法律状态
2019-07-23
授权
授权
2018-07-03
实质审查的生效 IPC(主分类):G06K9/00 申请日:20171124
实质审查的生效
2018-06-08
公开
公开
技术领域
本发明属于图像处理技术领域,更进一步涉及极化合成孔径雷达图像分类技术领域中的一种基于半监督梯形网络的极化合成孔径雷达SAR(Synthetic Aperture Radar)图像分类方法。本发明采用改进的半监督梯形网络对极化SAR 图像的每个像素进行特征表示,可用于极化合成孔径雷达SAR图像目标的地物分类和目标识别。
背景技术
合成孔径雷达(SAR)系统能够得到具有全天时、全天候、高分辨率的遥感图像,极化合成孔径雷达(PolSAR)是先进的SAR系统,通过发射和接收极化雷达波来观察到的土地覆盖物和目标,极化SAR图像包含丰富的地物信息,极大地增强了成像雷达对目标信息的获取能力。极化合成孔径雷达(PolSAR)作为合成孔径雷达技术中一个重要的研究方向,在农业生产、城市规划、海冰监测等众多领域内具有巨大的应用价值。
根据是否需要有标签样本,PolSAR图像分为监督分类和无监督分类。
西安电子科技大学其在申请的专利文献“基于SLIC和改进的CNN的极化 SAR图像分类方法”(专利申请号:201611054919.4,公开号:CN106778821A) 中提出了一种基于SLIC和改进的CNN的极化SAR图像分类方法。该方法首先根据极化SAR图像的九维极化数据,计算极化SAR图像每一像素点的Wishart距离, 并将该距离与九维极化数据合并,获得极化SAR图像新数据,利用Lee滤波方法, 对待分类的极化SAR图像进行精致Lee滤波;然后输入到已改进的CNN中进行分类,获得初步分类结果,然后将极化SAR图像的伪彩色图像进行SLIC超像素分割, 获得超像素分割结果,最后利用超像素分割结果对初步分类结果进行约束后处理, 获得最终分类结果。该方法虽然充分利用了极化SAR图像的有标签数据,提高了有监督极化SAR图像分类的分类速度和分类精度。但是,该方法仍然存在的不足之处是,该方法提取特征的过程复杂且需要一组足够多的已标记数据作为训练集,在已标记数据较少的情况下易导致分类正确率较低,大量无标记数据信息浪费的问题。
西安电子科技大学在其申请的专利“基于谱聚类的极化SAR图像分类方法” (专利申请号:201210424175.6,公开号:CN102982338A)中公开了一种基于谱聚类的极化SAR图像分类方法。该方法首先提取表征极化SAR目标散射特征的散射熵H,结合空间坐标信息,作为MeanShift算法的输入特征空间;在特征空间用 MeanShift算法进行分割,得到M个区域;在M个区域上,选取各区域的代表点作为谱聚类的输入,对各区域进行谱分割,进而完成对所有像素点的谱聚类,获得预分类结果;最后,对预分类得到的整幅图像用能反映极化SAR分布特性的Wishart 分类器进行迭代分类,得到分类结果。该方法虽然可对极化SAR图像进行无监督分类,减轻了获取标记样本的压力。但该方法存在的不足之处是,操作复杂,需要自主提取一部分特征,无监督分类没有标记样本的标签指导,导致无监督学习通常很难保证较高的学习精度。
发明内容
本发明的目的在于克服上述已有技术的不足,提出一种半监督梯形网络的极化合成孔径雷达SAR(Synthetic Aperture Radar)图像分类方法。本发明充分利用无标记数据和标记数据,构造损失函数,使监督学习与无监督学习相结合,通过最小化带噪声编码路径对同一样本多次分类的结果差异,在只有少量有标记数据的情况下,充分利用大量无标记数据提取更丰富的特征,提高分类精度和分类效率。
实现本发明上述目的的思路是:对待分类的极化SAR图像进行精致Lee滤波;从滤波后极化合成孔径雷达SAR图像的有标记分类数据中选取训练样本和测试样本;搭建梯形网络结构;用选取的训练样本对梯形网络进行训练,并利用训练后的干净编码路径的softmax分类器,对待分类的极化合成孔径雷达SAR图像的每个像素进行分类;计算极化SAR图像的分类精度;对分类后的极化SAR图像进行上色输出。
实现本发明目的的具体步骤如下:
(1)输入图像:
(1a)输入一幅750*1024大小的待分类的极化合成孔径雷达SAR图像;
(1b)输入待分类极化合成孔径雷达SAR图像的真实地物标记图像;
(2)精致Lee滤波:
采用精致Lee滤波方法,对待分类的极化合成孔径雷达SAR图像进行滤波,去除斑点噪声,得到滤波后的极化合成孔径雷达SAR图像;
(3)选取训练样本和测试样本;
从滤波后极化合成孔径雷达SAR图像的有标记分类数据中,选取训练样本和测试样本;
(4)搭建梯形网络结构:
(4a)搭建梯形网络中的并行编码器,随机初始化并行编码器的权值和偏置;
(4b)搭建与带噪声编码路径对应的解码器,在带噪声编码路径的编码层与解码器的解码层之间建立横向连接,使解码结果与带噪编码层变量非线性组合,获得对应层的重构;
(5)训练梯形网络:
(5a)分别构建有监督损失函数、带噪声编码路径的无监督损失函数和与带噪声编码路径对应的解码器的无监督损失函数,线性组合有监督损失函数和无监督损失函数构成梯形网络的损失函数;
(5b)设定权值更新迭代的次数,在每次迭代中,利用所有训练样本求得当前损失函数的梯度值,并根据梯度下降法更新并行编码器的权值直至达到设定迭代次数,得到训练好的梯形网络;
(6)分类:
利用训练好的梯形网络中干净编码路径的softmax分类器,对待分类的极化合成孔径雷达SAR图像的每个像素进行分类,得到每个像素所属地物类别;
(7)计算精度:
将极化合成孔径雷达SAR图像的每个像素所属地物类别与真实地物类别进行比对,将类别一致的像素个数与全部像素个数的比值作为极化SAR图像的分类精度;
(8)输出结果:
利用红、绿、蓝三基色,将相同类别的极化合成孔径雷达SAR图像像素用同一种颜色标出,得到上色后的极化合成孔径雷达SAR图像并输出图像。
本发明与现有技术相比具有以下优点:
第一,由于本发明采用将有监督和无监督结合的半监督学习方式,重构损失函数,通过最小化带噪声编码路径对同一样本多次分类的结果差异,在只有少量有标记数据的情况下,充分利用大量无标记数据提取更丰富的特征,克服了现有技术提取特征的过程复杂且需要一组足够多的已标记数据作为训练集,在已标记数据较少的情况下易导致分类正确率较低,大量无标记数据信息浪费的问题,使得本发明在少量已标记数据的情况下,充分利用无标记数据,提高了图像的分类精度。
第二,由于本发明在带噪声编码路径的编码层与解码器的解码层之间建立横向连接,克服了现有技术操作复杂,需要自主提取一部分特征,无监督分类没有标记样本的标签指导,导致无监督学习通常很难保证较高的分类精度的问题,使得本发明中梯形网络的权值更新有已标记数据的标签指导,用于图像分类时能提高分类效率。
附图说明
图1是本发明的流程图;
图2是本发明的仿真图;其中:
图2(a)是本发明实施例中待分类极化合成孔径雷达SAR图像示意图;
图2(b)是本发明实施例中待分类极化合成孔径雷达SAR图像真实地物标记图像示意图;
图2(c)是采用支持矢量机SVM分类方法,对待分类极化合成孔径雷达SAR 图像进行分类的结果图;
图2(d)是采用原始梯形网络分类方法对待分类极化合成孔径雷达SAR图像进行分类的结果图;
图2(e)是本发明对梯形网络重新构建损失函数后对待分类极化合成孔径雷达SAR图像进行分类的结果图。
具体实施方式
下面结合附图对本发明做进一步的描述。
参照图1,本发明的具体实施步骤如下。
步骤1.输入图像。
输入一幅750*1024大小的待分类的极化合成孔径雷达SAR图像。
输入待分类极化合成孔径雷达SAR图像的真实地物标记图像。
步骤2.精致Lee滤波。
采用精致Lee滤波方法,对待分类的极化合成孔径雷达SAR图像进行滤波,去除斑点噪声,得到滤波后的极化合成孔径雷达SAR图像。
步骤3.选取训练样本和测试样本。
从滤波后极化合成孔径雷达SAR图像的有标记分类数据中,选取训练样本和测试样本。
所述的从滤波后极化合成孔径雷达SAR图像的有标记分类数据中提取训练样本和测试样本的步骤如下:
第一步,从滤波后极化合成孔径雷达SAR图像的有标记分类数据的每类数据中,随机选取10%的样本,将所有选出的样本组合在一起,作为训练样本。
第二步,从训练样本中随机选取1500个样本作为有监督训练样本,剩余训练样本作为无监督训练样本。
第三步,从选过训练样本后剩余的极化合成孔径雷达SAR图像中,选取有标记的数据作为测试样本。
步骤4.搭建梯形网络结构。
搭建梯形网络中的并行编码器,随机初始化并行编码器的权值和偏置。
所述梯形网络中的并行编码器的结构如下:并行编码器使用全连接的多层感知器作为基模型,并行编码器分为纵横两个编码路径,其中,加入高斯噪声的一个路径为带噪声编码路径,不加高斯噪声的另一个路径为干净编码路径,两个编码路径的网络层数、每层神经元个数以及每层的前向编码函数保持实时一致。
并行编码器的参数如下:
第一层为输入层,神经元个数设置为9。
第二层为编码层,神经元个数设置为1000。
第三层为编码层,神经元个数设置为500。
第四层为编码层,神经元个数设置为250。
第五层为编码层,神经元个数设置为250。
第六层为编码层,神经元个数设置为250。
第七层为softmax分类器,神经元个数设置为15。
搭建与带噪声编码路径对应的解码器,在带噪声编码路径的编码层与解码器的解码层之间建立横向连接,使解码结果与带噪编码层变量非线性组合,获得对应层的重构。
所述与带噪声编码路径对应的解码器的结构及其参数如下:
第一层为重构层,神经元个数设置为15。
第二次为重构层,神经元个数设置为250。
第三层为重构层,神经元个数设置为250。
第四层为重构层,神经元个数设置为250。
第五层为重构层,神经元个数设置为500。
第六层为重构层,神经元个数设置为1000。
第七层为重构层,神经元个数设置为9。
步骤5.训练梯形网络。
分别构建有监督损失函数、带噪声编码路径的无监督损失函数和与带噪声编码路径对应的解码器的无监督损失函数,线性组合有监督损失函数和无监督损失函数构成梯形网络的损失函数。
所述有监督损失函数如下:
其中,Cc表示带噪声编码路径的有监督损失函数,Nc表示有监督样本的总数,∑表示求和操作,m表示有监督样本的序号,ym表示第m个有监督样本的标签,log>表示带噪声编码路径中的softmax分类器对第m个有监督样本的分类结果。
所述带噪声编码路径的无监督损失函数如下:
其中,Cu表示带噪声编码路径的无监督损失函数,N表示无监督样本的总数,∑表示求和操作,i表示第i个无监督样本的序号,k表示每个训练样本重复通过带噪声编码路径提取特征的总次数,j表示无监督样本通过带噪声编码路径提取特征的次数,t表示无监督样本通过带噪声编码路径提取特征的次数,fj(xi)表示带噪声编码路径的softmax分类器对第i个无监督样本第j次通过带噪声编码路径提取特征的分类结果,ft(xi)表示带噪声编码路径的softmax分类器对第i个无监督样本第t次通过带噪声编码路径提取特征的分类结果,||>2表示平方操作。
所述与带噪声编码路径对应的解码器的无监督损失函数如下:
其中,Cd表示与带噪声编码路径对应的解码器的无监督损失函数,∑表示求和操作,H表示并行编码器的网络总层数,h表示并行编码器网络层数的序号,N表示无监督样本的总数,mh表示并行编码器第h层神经元的总数,i表示第i个无监督样本的序号,z(h)(xi)表示第i个无监督样本在干净编码路径中第h层的特征,表示第i个无监督样本在带噪编码路径中第h层的特征,||>2表示平方操作。
所述线性组合监督损失函数和无监督损失函数构成梯形网络的损失函数如下:
C=Cc+Cu+Cd
其中,C表示梯形网络的损失函数,Cc表示带噪声编码路径的有监督损失函数,>u表示带噪声编码路径的无监督损失函数,Cd表示与带噪声编码路径对应的解码器的无监督损失函数。
设定权值更新迭代的次数,在每次迭代中,利用所有训练样本求得当前损失函数的梯度值,并根据梯度下降法更新并行编码器的权值直至达到设定迭代次数,得到训练好的梯形网络。
步骤6.分类。
利用训练好的梯形网络中干净编码路径的softmax分类器,对待分类的极化合成孔径雷达SAR图像的每个像素进行分类,得到每个像素所属地物类别。
步骤7.计算精度。
将极化合成孔径雷达SAR图像的每个像素所属地物类别与真实地物类别进行比对,将类别一致的像素个数与全部像素个数的比值作为极化SAR图像的分类精度。
步骤8.输出结果。
利用红、绿、蓝三基色,将相同类别的极化合成孔径雷达SAR图像像素用同一种颜色标出,得到上色后的极化合成孔径雷达SAR图像并输出图像。
本发明的效果可通过以下仿真进一步说明。
1、仿真条件:
本发明的仿真试验是在Intel(R)Core(TM)i5-6500@3.20GHZ、64.0GB RAM的硬件环境和Spyder的软件环境下进行的,编程所依赖的深度学习库有numpy、 tensorflow
2、仿真内容:
图2本发明的仿真图,仿真实验中所有的极化合成孔径雷达SAR图像的尺寸大小均为750×1024。其中,图2(a)是NASA-JPL机载L波段AIRSAR系统于1991年获取的荷兰Flevoland农田区域极化合成孔径雷达SAR的RGB合成图。该极化合成孔径雷达SAR图像中区域的地表覆盖物为各种农作物和水域。图2(b)是图2(a)所示极化合成孔径雷达SAR图像的真实地物标记图。仿真实验按15类对图2(a)中区域的地表覆盖物为各种农作物和水域进行分类。
本发明的仿真内容为:
仿真实验1,利用1500个有标记样本训练支持向量机SVM,使用训练好的支持向量机SVM分类方法对图2(a)中区域的地表覆盖物为各种农作物和水域进行分类,分类的结果如图2(c)所示。
仿真实验2,利用1500个有标记样本和10%的无标记样本训练未重构损失函数的梯形网络,并使用训练好的未重构损失函数的梯形网络对图2(a)中区域的地表覆盖物为各种农作物和水域进行分类,分类的结果如图2(d)所示。
仿真实验3,采用本发明方法对图2(a)中区域的地表覆盖物为各种农作物和水域进行分类的结果图,分类的结果如图2(e)所示。
统计三种仿真实验得到的分类精度以及达到对应分类精度时的迭代次数,结果如表1。其中,Alg1表示支持矢量机SVM分类方法,Alg2表示未重构损失函数的梯形网络分类方法,Alg3表示本发明的分类方法。
2、仿真结果分析:
分别将图2(c)、图2(d)和图2(e)与本发明仿真所用待分类极化SAR图像的真实地物标记图2(b)对比可以看出,图2(e)相比于对比方法图2(c)和图2(d),更加待接近分类极化SAR图像的真实地物标记图,而且图2(e)中各类地物的区分更加的细致,准确。
表1.三种方法在仿真中得到的分类精度和迭代次数一览表
从表1可见,本发明相比两种对比仿真实验,精度有较大的提高,与未重构损失函数的梯形网络分类方法相比,迭代次数大幅下降,大大提高了梯形网络的训练速度,这主要是因为本发明重构梯形网络的损失函数,通过最小化带噪声编码路径对同一样本多次分类的结果差异,充分利用大量无标记数据提取更丰富的特征,使分类精度更高。
机译: 半监督基于学习的图像分类方法和装置,以及计算机设备
机译: 基于半监督学习和LSTM模型的词语级情感嵌入对话的LSTM情感分类方法
机译: 基于半监督学习和LSTM模型的词语级情绪嵌入对话中的情感分类方法