首页> 中国专利> 基于卡方‑棋盘距离度量的弱监督极化SAR分类方法

基于卡方‑棋盘距离度量的弱监督极化SAR分类方法

摘要

本发明公开了一种基于卡方‑棋盘距离度量的弱监督极化SAR分类方法,主要解决目前弱监督方法的分类精度低的问题。其实现方案包括:1)读入一幅极化SAR图像,基于Cloude‑Pottier目标分解方法,构造具有四维特征的极化矩阵;2)从极化矩阵中选取1%的标记样本作为训练样本;3)分步计算测试样本和训练样本的卡方距离以及空间棋盘距离;4)根据卡方距离和棋盘距离得到组合距离,将其作为最近邻方法评判近邻的标准,实现极化SAR图像分类。本发明仅采用少量训练样本利用最近邻分类器,精确实现了极化SAR的地物分类。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-07-23

    授权

    授权

  • 2017-12-12

    实质审查的生效 IPC(主分类):G06K9/62 申请日:20170707

    实质审查的生效

  • 2017-11-17

    公开

    公开

说明书

技术领域

本发明属于图像处理技术领域,具体涉及极化SAR的地物分类方法,可用于地物分类。

背景技术

合成孔径雷达SAR是一种具有全天时全天候的高分辨成像雷达,由于SAR对地表具有一定的穿透能力,能够排除云雾植被以及树叶的干扰,在测绘和军事、环境监测、灾害监测、海洋监测等方面具有得天独厚的优势,因而针对SAR图像的数据分析和解译也引来国内外科研人员的广泛关注。极化SAR的出现,使图像的每个像素包含了地物的更多极化信息数据,为地物分类提供更多的分析依据。

目前极化SAR的分类方法主要有有监督方法、无监督方法、以及半监督方法。有监督的方法普遍依赖于大量的标记样本,然而大量标记样本的获取是非常昂贵和困难的,这增加了图像数据解译的难度,而且对大量标记的极化SAR数据进行训练也增加了时间复杂度和计算复杂度,由此可见,有监督的方法并不是一个行之有效的方法。目前的无监督的方法也比较成熟,不依赖于任何标记样本,但是无监督方法往往会分出许多额外的类别,这大大超出了需要分类的类别数,后期的处理会存在太多干扰。半监督方法,能够利用少量标记样本和大量未标记样本的策略,在目前看来是一种很有潜力的方法,但是还是有较高的时间复杂度和模型复杂度。

发明内容

本发明的目的是针对上述现有技术中的诸多不足,提出一种基于卡方-棋盘距离度量的弱监督极化SAR分类方法,以降低分类模型的复杂度和时间复杂度,提高极化SAR分类速度和分类精度。

本发明的技术方案是基于现有目标分解的方法,仅需少量标记样本,采用卡方-棋盘组合度量方式作为最近邻分类器的近邻评判依据,从而实现弱监督极化SAR分类,其实现步骤包括如下:

(1)读入一幅极化SAR待分类图像数据,得到3×3的目标的极化相干矩阵T,以相干矩阵T作为输入,进行Cloude-Pottier的目标分解,得到具有四维特征的极化矩阵X:

其中xi为第i个样本,N为样本总数,P为回波强度参数,H为散射熵,α为散射角,A为各向异度;

(2)随机从样本集X中选取1%的样本为训练样本集S,其余为测试样本集T:

其中si是训练样本集的第i个样本,i=1,2,…,n,tj是测试样本集的第j个样本,j=1,2,…,k,n为训练样本总数,n=N×0.01,每类选取nc个训练样本:nc=n/NC,NC为分类类别总数,k为测试样本总数,k=N-n;

(3)分步计算测试样本tj和训练样本si的卡方距离和空间棋盘距离dchess(L,L′):

dchess(L,L′)=max(|l1-l1′|,|l2-l2′|),

其中sim是si的第m维的取值,tjm是tj的第m维的取值,m=1,2,3,4;

为训练样本si的空间坐标,为测试样本tj的空间坐标,l1是si在空间中的横坐标,l2是si在空间中纵坐标,l1′是tj在空间中的横坐标,l2′是tj在空间中的纵坐标;

(4)根据步骤(3)的结果,计算测试样本tj与训练样本si的组合距离d(si,tj):

其中e(·)表示取指数操作,ln(·)表示取对数操作;

(5)利用最近邻分类器NN,计算测试样本tj与训练样本集S中每一个样本的组合距离d(si,tj),得到距离集合{dj1,dj2,…,d,…,djn},将距离最小的d对应的训练样本sξ的标签设为测试样本tj的标签;

(6)重复上述(3)-(5),对其余测试样本预测标签,最终实现极化SAR图像分类。

本发明的有益效果是:

1)采用基于目标分解的方法,构造具有四维特征的极化矩阵,有效简化

极化SAR图像的数据结构。

2)本发明是仅需少量标记样本的弱监督极化SAR方法。

3)本发明采用特殊组合度量方式作为最近邻分类器NN的近邻评判依据,

从而降低了模型的复杂度和时间复杂度,提高极化SAR的分类精度和

分类速度。

以下将结合附图对本发明做进一步详细说明。

附图说明

图1本发明的实现流程图;

图2真实类标图;

图3采用本发明和现有两种方法对图2的地物分类图。

具体实施方式

为了使本领域技术人员更好的理解本发明,下面参照附图对本发明进行详细说明。

参照图1,本发明的实现步骤包括如下:

步骤1,读入一幅极化SAR待分类图像数据,得到极化散射矩阵Sc,通过正交复Pauli矩阵基将Sc矢量化,由散射矢量得到3×3的目标的极化相干矩阵T。

(1.1)读入一幅极化SAR图像数据,得到极化散射矩阵Sc

其中shh表示以水平方向发射,水平方向接收,shv表示以水平方向发射,垂直方向接收,svh表示以垂直方向发射,水平方向接收,svv表示以垂直方向发射,垂直方向接收,由互易定理可知Shv=Svh

(1.2)通过旋转正交复Pauli矩阵基Pl,将极化散射矩阵Sc矢量化,得到Pauli散射矢量

其中trace(·)是求取矩阵的迹,上标“T”表示转置,

(1.3)由散射矢量得到3×3相干矩阵T:

其中上标“*”表示共轭转置。

步骤2,以相干矩阵T作为输入,进行Cloude-Pottier的目标分解,得到具有四维特征的极化矩阵X。

(2.1)对相干矩阵T进行如下特征分解:

其中λt是相干矩阵T的第t个特征值,t=1,2,3,上标“*”表示共轭转置,et是相干矩阵T正交化后的第t个单位特征矢量;

(2.2)计算相干矩阵T的极化熵H:

其中为第t种散射机制发生的概率,t=1,2,3;

(2.3)计算相干矩阵T的散射角α:

其中αt是第t种散射机制的类型,t=1,2,3;

(2.4)计算相干矩阵T的各向异度A:

其中p2是第2种散射机制发生的概率,p3是第3种散射机制发生的概率;

(2.5)计算相干矩阵T的回波强度参数P:

(2.6)根据(2.2)-(2.5)构建第i个样本xi的四维特征:

其中P为回波强度参数,H为散射熵,α为散射角,A为各向异度;

(2.7)其余样本重复(2.6)得到具有四维特征的极化矩阵X:

其中N为样本总数。

步骤3,选取训练、测试样本,计算这两种样本组合距离d(si,tj)。

(3.1)随机从样本集X中选取1%的样本为训练样本集S,其余为测试样本集T:

其中si是训练样本集的第i个样本,i=1,2,…,n,tj是测试样本集的第j个样本,j=1,2,…,k,n为训练样本总数,n=N×0.01,每类选取nc个训练样本:nc=n/NC,NC为分类类别总数,k为测试样本总数,k=N-n。

(3.2)计算测试样本tj和训练样本si的卡方距离

(3.3)计算测试样本tj和训练样本si空间棋盘距离dchess(L,L′):

dchess(L,L′)=max(|l1-l1′|,|l2-l2′|),

其中sim是si的第m维的取值,tjm是tj的第m维的取值,m=1,2,3,4;

为训练样本si的空间坐标,为测试样本tj的空间坐标,l1是si在空间中的横坐标,l2是si在空间中纵坐标,l1′是tj在空间中的横坐标,l2′是tj在空间中的纵坐标。

(3.4)根据步骤(3.2)-(3.3)的结果,计算测试样本tj与训练样本si的组合距离d(si,tj):

其中e(·)表示取指数操作,ln(·)表示取对数操作。

步骤4,根据组合距离d(si,tj),实现极化SAR的地物分类。

(4.1)利用最近邻分类器NN,计算测试样本tj与训练样本集S中每一个样本的组合距离,得到距离集合{dj1,dj2,…,d,…,djn},d是训练样本sξ与测试样本tj的组合距离d(sξ,tj),ξ=1,2,…,n,n为训练样本个数;

(4.2)将距离集合里{dj1,dj2,…,d,…,djn}的距离从小到大排列,用该距离最小值对应的训练样本标签作为第j个测试样本tj的标签;

(4.3)重复上述步骤(4.1)-(4.2),对其余测试样本预测标签,最终实现极化SAR地物分类。

本发明的效果可以通过以下仿真实验进一步说明。

1.实验条件:本实验在CPU为Intel(R)Xeon(R),主频为2.40GHz,内存为16G的WINDOWS 7系统上采用软件MATLAB R2013b进行仿真。

本实验选择NASA/JPLARISAR获取的荷兰Flevoland地区的L波段数据,利用它的一个子图Flevoland1,如图2所示,大小为300×270。该区域共有6类地物,分别是马铃薯、甜菜、裸地、大麦、小麦、豌豆。样本总数为81000,按照(3.1)中所述选择训练样本,有标记样本数为46659,选取其中1%作为训练样本,训练样本总数为468,每类选取样本数为78。

2.实验内容

实验采用本发明和现有两种对比方法对图2进行分类,其中对比方法1是基于欧式距离的最近邻分类方法,对比方法2是基于核度量的SVM分类方法,分类结果如图3,其中:

图3(a)为本发明方法的分类结果图,

图3(b)为对比方法1的分类结果图,

图3(c)为对比方法2的分类结果图。

图3展示了本发明方法与两种对比方法大致的分类效果,能够看出本发明明显优于对比方法。

计算本发明方法和对比方法的总体分类精度及卡帕系数,结果如表1。

表1本发明方法与两种对比方法的分类结果

本发明方法对比方法1对比方法2总体分类精度(%)97.2352.2353.14卡帕系数0.960.40590.4206时间(s)14.6210.78.42

从表1可以看出,本发明比两种对比方法的分类精度分别提高45%和44.09%,同时卡帕系数远高于这两种对比方法,说明本发明分类的一致性最好。

上述结果表明本发明能够精确实现极化SAR分类。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号