技术领域
本发明涉及雷达遥感图像处理技术领域,具体为一种PolSAR影像半监督分类方法。
背景技术
合成孔径雷达(SAR)系统是一种主动微波成像系统,可以在白天和夜间以及各种天气条件下获得高分辨率图像。极化SAR(PolSAR)系统作为SAR的一种高级形式,可以在不同的极化模式下对观测到的地表覆盖类型进行表征,并具有较强的散射信息获取能力,因此得到了广泛的应用。
近年来,基于深度学习的遥感影像分类技术在PolSAR影像分类领域得到了越来越广泛的应用。深度学习作为机器学习的一个子集,可以有效地处理大量数据,并具有很强的特征提取能力。在深度判别网络中,实数卷积神经网络(RV-CNN)模型是最受欢迎的模型之一。由于具有特殊的多维卷积运算,RV-CNN模型在图像数据分类中具有显著优势。然而,RV-CNN模型只使用了PolSAR图像的振幅信息,而忽略了相位信息。对于以协方差矩阵或相干矩阵表示的PolSAR数据,非对角线元素的相位对不同类型散射体的区分起着重要作用。
深度学习技术在PolSAR影像解译中取得了巨大的成功,总体上来说,取得了比传统分类器更好的性能。然而,基于深度学习技术模型的分类结果在很大程度上依赖于大量的标记样本。缺乏训练样本往往导致分类结果较差,因此,半监督分类在深度学习中逐渐流行,因为它避免了获取大量标记样本这一劳动密集型任务,并且可以充分利用已有的标记训练样本。在光学遥感图像分类领域产生了很多半监督分类算法。然而,对于PolSAR影像分类领域,半监督分类算法的研究相对不足。深度学习的另一个缺点是,它往往在区分具有相似纹理但不同散射特性的物体时有困难。相比之下,传统的分类器,如Wishart分类器是基于复Wishart分布,可以充分利用到PolSAR数据的散射特征。因此,每种方法都有自己的优缺点。基于多分类器的融合策略已被大量开发出来,其主要目的是充分利用各分类器的优势。从理论上讲,多分类器的组合通常能够获得更好的分类结果。多数投票是应用最广泛的多分类器集成策略之一,它主要利用到选择投票票数最多的预测类。
目前,深度学习方法和遥感影像信息提取是近年来的研究热点之一,深度学习在极化合成孔径雷达(PolSAR)图像分类中取得了巨大的成功。然而,当标记训练数据集不充分时,分类结果往往不理想。此外,深度学习方法是基于层次特征的,这是一种不能充分利用PolSAR影像散射特性的方法,故具有局限性,基于此,本发明设计了一种PolSAR影像半监督分类方法,以解决上述问题。
发明内容
本发明的目的在于提供一种PolSAR影像半监督分类方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种PolSAR影像半监督分类方法,包括如下步骤:
S1:在少量训练样本的基础上,利用Wishart分类器、SVM分类器和CV-CNN模型对样本进行分类,分类结果再进行多数投票,产生强数据集和弱数据集;
S2:将强数据集作为伪标签,用CV-CNN模型对弱数据集进行重新分类,为了充分利用强数据集,利用强数据集产生的伪标签对弱数据集重新分类三次,通过多数投票的方式对三种分类结果进行整合;
S3:最后将强数据集与重分类结果相结合,得到最终分类结果;
所述CV-CNN模型由输入层、输出层、卷积层、池化层和全连接层组成,卷积层的作用是对滤波器进行卷积,提取出前一层神经元的不同特征。对于输入图像,每个滤波器都会检测到特定的区域特征,即每个特征图代表前一层不同区域的特定特征。卷积层的输出结果可以写成:
其中j为虚数单位、*表示卷积运算、A和
池化层通常在卷积层之后,既可以简化空间结构,又可以合并输入特征映射的相似特征,池化层可以看作是一种降采样层;
在全连接层中,每个神经元都与前一层的所有神经元相连,可以将其视为一个特殊的卷积层;全连接层输出可以表示为:
式中M为第l个全连接层神经元数量;
输出层实际上是一个用复数向量表示的分类器,它表示像素属于某类别的概率;然后,通过最小化损失函数,以监督分类的方式学习网络中的所有参数,损失函数可以写成:
式中T[n]表示第n个输出层。
进一步的,所述步骤S1中,如果Wishart分类器、SVM分类器和CV-CNN模型同时对某个像素的分类类别一致,就用投票后的类标签将该像素分类到强数据集;否则,它将被划分为不确定类标签的弱数据集。
进一步的,所述步骤S2在多数投票过程中,从强数据集采集三次样本,之后将采集的样本作为伪标签通过CV-CNN模型进行三次训练和分类,投票结果和票数最多的类别一致。
进一步的,所述步骤S1中根据多数投票原则,如果一个像素被基分类器最频繁地识别为一个类,我们将这个类标签给该像素,该过程遵循了两个原则:多数人的决定优于个人的决定;好的分类器优于相对较差的分类器,根据大量研究表明,当考虑相干矩阵的元素和一些其他极化参数,如熵和散射角时,支持向量机的分类结果将优于基于极大似然原理的Wishart分类器,由于样本量太少,CV-CNN模型的分类结果可靠性不如SVM分类器的分类结果;因此,当三个分类器在投票系统中有不同的意见时,将SVM分类器的结果作为最终结果。
进一步的,所述步骤S1中还包括对于一幅极化SAR影像P,基于少量样本的情况下,采用三种分类器对P进行分类,产生三个分类结果,多数投票步骤如下:对于某个像素p,如果三个分类器的结果互相冲突,也就是两两不一致,则把SVM分类器的分类结果类别A设定为该像素的分类类别;如果三个分类器的分类结果一致,则把一致的结果设定为该像素的类别;如果三个分类器的结果中其中两个结果一致,则把两个一致的结果设定为该像素的分类类别。
进一步的,所述步骤S2中多数投票的结果都是CV-CNN模型所产生的,而且分类所采用的训练样本量得到了很大提升,多数投票步骤如下:对于某个像素q,如果三个分类结果互相冲突,也就是两两不一致,则把精度最高的CV-CNN分类结果设定为该像素的分类类别;如果三个分类器的分类结果一致,则把一致的结果设定为该像素的类别;如果三个分类器的结果中其中两个结果一致,则把两个一致的结果设定为该像素的分类类别。
与现有技术相比,本发明的有益效果是:本发明采用多数投票的方法扩充CV-CNN模型的训练样本,进一步提高分类性能,同时充分利用各分类器各自的优势,在训练样本数量较少的情况下,提高分类的总体精度,该方法相对于传统的监督分类方法具有显著优越性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明方法流程图;
图2为本发明CV-CNN模型结构示意图;
图3为本发明第一次多数投票流程图;
图4为本发明第二次多数投票流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“上”、“下”、“前”、“后”、“左”、“右”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
请参阅图1-4,本发明提供一种技术方案:一种PolSAR影像半监督分类方法,包括如下步骤:
S1:在少量训练样本的基础上,利用Wishart分类器、SVM分类器和CV-CNN模型对样本进行分类,分类结果再进行多数投票,产生强数据集和弱数据集,从而扩展了标记的训练样本,避免因缺乏标记样本而导致较差的分类结果;根据多数投票原则,如果一个像素被基分类器最频繁地识别为一个类,我们将这个类标签给该像素,该过程遵循了两个原则:多数人的决定优于个人的决定;好的分类器优于相对较差的分类器,根据大量研究表明,当考虑相干矩阵的元素和一些其他极化参数,如熵和散射角时,支持向量机的分类结果将优于基于极大似然原理的Wishart分类器,由于样本量太少,CV-CNN模型的分类结果可靠性不如SVM分类器的分类结果;因此,当三个分类器在投票系统中有不同的意见时,将SVM分类器的结果作为最终结果;在对于一幅极化SAR影像P,基于少量样本的情况下,采用三种分类器对P进行分类,产生三个分类结果,多数投票步骤如下:对于某个像素p,如果三个分类器的结果互相冲突,也就是两两不一致,则把SVM分类器的分类结果类别A设定为该像素的分类类别;如果三个分类器的分类结果一致,则把一致的结果设定为该像素的类别;如果三个分类器的结果中其中两个结果一致,则把两个一致的结果设定为该像素的分类类别;
S2:将强数据集作为伪标签,用CV-CNN模型对弱数据集进行重新分类,为了充分利用强数据集,利用强数据集产生的伪标签对弱数据集重新分类三次,通过多数投票的方式对三种分类结果进行整合;多数投票的结果都是CV-CNN模型所产生的,而且分类所采用的训练样本量得到了很大提升,多数投票步骤如下:对于某个像素q,如果三个分类结果互相冲突,也就是两两不一致,则把精度最高的CV-CNN分类结果设定为该像素的分类类别;如果三个分类器的分类结果一致,则把一致的结果设定为该像素的类别;如果三个分类器的结果中其中两个结果一致,则把两个一致的结果设定为该像素的分类类别;
S3:最后将强数据集与重分类结果相结合,得到最终分类结果;
CV-CNN模型由输入层、输出层、卷积层、池化层和全连接层组成,卷积层的作用是对滤波器进行卷积,提取出前一层神经元的不同特征。对于输入图像,每个滤波器都会检测到特定的区域特征,即每个特征图代表前一层不同区域的特定特征。卷积层的输出结果可以写成:
其中j为虚数单位、*表示卷积运算、A和
池化层通常在卷积层之后,既可以简化空间结构,又可以合并输入特征映射的相似特征,池化层可以看作是一种降采样层;
在全连接层中,每个神经元都与前一层的所有神经元相连,可以将其视为一个特殊的卷积层;全连接层输出可以表示为:
式中M为第l个全连接层神经元数量;
输出层实际上是一个用复数向量表示的分类器,它表示像素属于某类别的概率;然后,通过最小化损失函数,以监督分类的方式学习网络中的所有参数,损失函数可以写成:
式中T[n]表示第n个输出层。
其中,步骤S1中,如果Wishart分类器、SVM分类器和CV-CNN模型同时对某个像素的分类类别一致,就用投票后的类标签将该像素分类到强数据集;否则,它将被划分为不确定类标签的弱数据集;
在获得强数据集并扩大训练样本数量后,可以使用更多的样本对PolSAR影像进行分类;一般来说,CV-CNN模型只对弱数据集进行一次分类更容易,也更快,但是为了充分利用强数据集和抑制错误分类像素的干扰,步骤S2在多数投票过程中,从强数据集采集三次样本,之后将采集的样本作为伪标签通过CV-CNN模型进行三次训练和分类,投票结果和票数最多的类别一致。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。
机译: 半监督基于学习的图像分类方法和装置,以及计算机设备
机译: 基于半监督学习和LSTM模型的词语级情感嵌入对话的LSTM情感分类方法
机译: 基于半监督学习和LSTM模型的词语级情绪嵌入对话中的情感分类方法