首页> 中国专利> 一种高分辨率遥感图像复杂类别的监督分类方法

一种高分辨率遥感图像复杂类别的监督分类方法

摘要

本发明涉及遥感图像处理技术领域,尤其涉及一种高分辨率遥感图像复杂类别的监督分类方法。本发明通过对高分辨率遥感图像提取局部特征和使用局部特征矢量集代表图像,更详细地、准确地描述了图像内容,避免了使用全局特征时,各种类别的特征信息混杂在一起;通过多维金字塔表达将局部特征矢量集转化为一个表达矢量,使得默认输入是矢量的监督分类方法得以应用;多维金字塔表达方法在局部特征是高维特征时,仍保证较高的计算效率和分类精度;在获得多维金字塔表达矢量的基础上,通过AdaBoost挑选区分力强的少数维用于构建强分类器,避免了无关信息对分类精度的影响。本发明计算效率高,适用于高分辨率遥感图像,可有效提高高分辨率遥感图像复杂类别的分类精度。

著录项

  • 公开/公告号CN101777125A

    专利类型发明专利

  • 公开/公告日2010-07-14

    原文格式PDF

  • 申请/专利权人 武汉大学;

    申请/专利号CN201010107379.8

  • 发明设计人 曹永锋;殷慧;陈荣;

    申请日2010-02-03

  • 分类号

  • 代理机构武汉科皓知识产权代理事务所(特殊普通合伙);

  • 代理人张火春

  • 地址 430072 湖北省武汉市武昌珞珈山

  • 入库时间 2023-12-18 00:05:42

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-03-23

    未缴年费专利权终止 IPC(主分类):G06K9/62 授权公告日:20120111 终止日期:20150203 申请日:20100203

    专利权的终止

  • 2012-01-11

    授权

    授权

  • 2010-09-15

    实质审查的生效 IPC(主分类):G06K9/62 申请日:20100203

    实质审查的生效

  • 2010-07-14

    公开

    公开

说明书

技术领域

本发明涉及遥感图像处理技术领域,尤其涉及一种高分辨率遥感图像复杂类别的监督分类方法。

背景技术

针对遥感图像的监督分类一般流程是:首先取得各类别的遥感图像样本,提取样本的特征,根据样本信息和类别的先验知识确定判别函数(即分类器);然后对待分类的遥感图像提取-同样特征,代入分类器得到类别输出。特征的提取和选择,以及分类算法的选取是影响分类精度的关键。

从遥感图像可以提取许多底层特征,常见的有:基于图像灰度值的统计特征,边缘特征,纹理特征和形状特征等。随着遥感图像分辨率的不断提高,细节和结构的复杂性与随机性愈加明显,原来具有“特征一致性”的简单类别可能会变成“特征不一致”的复杂类别。这会使基于底层特征的分类算法精度降低。在计算机视觉和模式识别领域,针对高分辨率的光学图像分类,流行的趋势是先使用检测算子找到图像的关键区域,然后在关键区域上计算局部特征,得到局部特征矢量集合并通过描述模型对图像进行描述,最后进行分类识别。这个方法在高分辨率遥感图像中也同样适用。但是,很多传统的机器学习方法不能直接利用局部特征矢量集合作为输入,因为这些机器学习方法默认的输入都是特征矢量。为了解决这个问题,需要对局部特征矢量集合进行再表达,将其映射为一个矢量,以利于传统机器学习方法使用。常用的将局部特征矢量集合表达成矢量的方法有:bag-of-features(BOF)和金字塔表达。

BOF事先通过对局部特征矢量集合聚类(如使用k-means)建立特征原型库,然后用特征原型在图像中出现的概率构成的矢量表达图像,如何自动确定最佳的聚类中心数是BOF有待解决的问题。

参考美国专利US2007/0217676中公开的金字塔表达方法,通过直接划分特征空间获取特征原型库,回避了聚类问题,并且金字塔表达对特征空间由细到粗的进行多层划分(每次划分对应于金字塔的一层)较细致的刻画了特征矢量在特征空间的分布。但是金字塔表达存在两个缺点:(1)金字塔表达矢量长度(即维数)与局部特征维数呈指数关系,与金字塔的层数呈线性关系。在使用高维局部特征情况下,其表达效率不可接受;(2)由于高维局部特征矢量往往只是聚集在特征空间的某个小角落,有限层(计算效率的限制)的金字塔并不能将这个小“角落”精细划分,导致金字塔表达矢量在使用高维特征的分类应用中缺乏区分力。

由于使用局部特征描述高分辨率遥感图像,一些无关信息必然对最终的表达矢量产生影响,所以需要选择一种可以挑选特征的监督分类方法以去除这些无关信息的干扰。

综上所述,针对高分辨率遥感图像的复杂类别监督分类,首先需要要提取高分辨率遥感图像的局部特征;其次,需要一种表达方法将局部特征矢量集合表达成一个矢量以方便传统监督分类方法的使用,同时这个方法最好在输入是高维局部特征时,也能够保证输出的表达矢量具有精细的信息而且计算效率高;最后,需要可以挑选特征的监督分类方法以去除无关信息的干扰。

发明内容

本发明的目的是提供一种高分辨率遥感图像复杂类别的监督分类方法,以提高高分辨率遥感图像复杂类别的分类精度和效率。

为达到上述目的,本发明采用如下的技术方案:

步骤1,通过高分辨率遥感图像处理程序打开高分辨率遥感图像;

步骤2,根据实际地物分布和分类类别数,在高分辨率遥感图像上利用样区工具选择训练样本,将训练样本存入训练样本库;

步骤3,利用兴趣点检测算子在训练样本上检测感兴趣区域;

步骤4,在检测到区域上提取局部特征,得到局部特征矢量,所有区域上得到的局部特征矢量构成局部特征矢量集合,将局部特征矢量集合存入特征库;

步骤5,用多维金字塔表达方法将局部特征矢量集合转化成一个表达矢量,并存入特征表达库;

步骤6,选择下一训练样本,重复步骤3到步骤5,直到完成所有训练样本的表达,得到完整的特征表达库;

步骤7,将属于第一类的表达矢量标记为正样本,所有不属于该类的表达矢量标记为负样本;

步骤8,输入AdaBoost,训练强分类器;

步骤9,将属于下一类的样本标记为正样本,所有不属于该类的样本标记为负样本,重复步骤8,直到完成所有类别的强分类器的训练;

步骤10,将待分类高分辨率遥感图像分解为图像子块;

步骤11,对一个图像子块重复步骤3到步骤5,但仅计算强分类器需要用到的多维金字塔表达矢量的特征维的取值,得到该图像子块的表达矢量;

步骤12,将图像子块的表达矢量输入各类的强分类器中,计算该表达矢量属于各类的概率;

步骤13,选择概率最大的那个类别作为图像子块的类别;

步骤14,将子块的类别赋予该子块覆盖的所有像素;

步骤15,选择下一图像子块,重复步骤11到步骤14,直到完成待分类遥感图像的所有像素的分类。

所述步骤5中对每个局部特征矢量集合完成多维金字塔表达包括以下子步骤:

步骤5.1,利用降维方法,将局部特征矢量降维;

步骤5.2,选择降维后的特征的第一维;

步骤5.3,在该维数据上计算金字塔表达矢量;

步骤5.4,选择降维后的特征的下一维,重复步骤5.3,直到在所有维上完成金字塔表达矢量的计算;

步骤5.5,将各维得到的金字塔表达矢量连接起来构成一个多维金字塔表达矢量。

所述步骤8中利用AdaBoost训练强分类器包括以下子步骤:

步骤8.1,假设一共有N个正负样本,每个样本的权重为1/N,令迭代序数t=1;

步骤8.2,取正负样本的第一维的数据,将所有数据按照大小排列;

步骤8.3,取第一个值和第二个值的中值,作为门限;

步骤8.4,统计利用此门限区分正负样本的误差率;

步骤8.5,取下一对相邻值的中值作为门限,重复步骤8.4,直到计算出所有门限下的分类误差率;

步骤8.6,取分类误差率最小的门限和此时两个类别相对门限的方向作为该维选择的弱分类器;

步骤8.7,取正负样本的下一维数据,将所有数据按照大小排列,重复步骤8.3到步骤8.6,直到所有维的弱分类器计算完毕;

步骤8.8,选择分类误差率最小的弱分类器,作为最佳弱分类器ht(x);

步骤8.9,通过以下公式计算ht(x)的权重,

αt=12log1-ϵtϵt

其中,εt为ht(x)的分类误差率;

步骤8.10,通过以下公式更新所有样本的权重:

dnt+1=dntexp{-αtynht(xn)}/Zt

其中,yn是样本的标号,Zt是使Σn=1Ndnt+1=1的归一化常量;

步骤8.11,t=t+1,重复步骤8.2到步骤8.10,直到满足以下任意一个条件:

①εt=0;②ϵt12;(3)t大于设定值;

步骤8.12,通过以下公式计算输出的强分类器:

f(x)=Σt=1TαtΣr=1Tαrht(x)

本发明具有以下优点和积极效果:

1)通过对高分辨率遥感图像提取局部特征,更详细地、准确地描述了图像内容,避免了使用全局特征时,各种类别的特征信息混杂在一起;

2)在获取局部特征矢量集合的基础上,通过多维金字塔表达得到表达矢量,使得默认输入是矢量的监督分类方法得以应用,而且多维金字塔表达方法在局部特征是高维特征时,仍保证较高的计算效率和分类精度;

3)在获得多维金字塔表达矢量的基础上,通过AdaBoost挑选区分力强的少数维用于构建强分类器,避免了无关信息对分类精度的影响;

4)计算效率高,适用于高分辨率遥感图像,可有效提高高分辨率遥感图像复杂类别的分类精度。

附图说明

图1是本发明中提出的多维金字塔表达的流程框图。

图2是本发明提出的高分辨率遥感图像复杂类别的监督分类方法的流程框图。

具体实施方式

下面以具体实施例结合附图对本发明作进一步说明:

为了便于理解本发明提出的高分辨率遥感图像复杂类别的监督分类方法,首先对本发明提出的多维金字塔表达理论进行阐述,图1是本发明中提出的多维金字塔表达的流程框图,多维金字塔表达的流程包括如下三个步骤:

1、对局部特征矢量集合10降维11以去除各维间的相关性;对局部特征矢量降维,一方面将高维特征矢量转化成低维特征矢量,简化计算,另一方面,降维后的特征各维间不相关,方便下一步将各维分别处理。

在具体实施时,用户要根据局部特征各维间的内在关系选择降维方法,例如,如果局部特征各维本来是线性相关,可用PCA降维,如果局部特征各维本来是非线性相关,可用流型方法降维等。

2、在降维后的特征的每一维上分别计算金字塔表达矢量12;

假设I表示一张图像,使用兴趣点检测算法从I中检测到m个显著区域{p1,p2,…,pm}。在每个区域pi中计算D维局部特征矢量xiFRD,结果图像I用一个特征矢量集合X={x1,…,xm}描述。经过降维,得到d维特征矢量xidFdRd,此时特征矢量集合变为Xd={x1d,...,xmd}.

假设在特征矢量的第j维上计算金字塔表达矢量,即此时特征空间为Fjd,特征矢量集合变为Xd(j)={x1d(j),...,xmd(j)}.再假设第j维数据的最大值是V。用直方图统计Xd(j)的分布,初始时令直方图bin的大小为1,所得直方图表示为H0(Xd(j))。随后,将直方图bin逐渐扩大(使其分别为2,4,…,2i,…V,)并计算对应的直方图,共可以得到个直方图。将所有直方图连接起来构成一个矢量就是金字塔表达矢量Ψ(Xd(j))=[H0(Xd(j)),…,HL-1(Xd(j))],其中Hi(Xd(j))表示第i个直方图,i=0,1,…,L-1,L也被称为金字塔的层数。

3、将各维得到的金字塔表达矢量连接起来13构成多维金字塔表达矢量14。

多维金字塔表达矢量表示为:MP(Xd)=[Ψ(Xd(1)),…,Ψ(Xd(d))]。

多维金字塔表达矢量的维数为:

R=Σj=1dΣi=0L-1ri(j)=Σj=1dΣi=0L-1(V/2i)

可见多维金字塔表达矢量的维数跟特征的维数呈正比,跟金字塔的层数也呈正比,即使输入是高维特征,多维金字塔表达方法仍然保持较高的计算效率,而且对高维特征空间任意细致的划分也不会显著降低计算效率,同时又使输出的多维金字塔表达矢量具有精细的信息。

本发明提供的高分辨率遥感图像复杂类别的监督分类方法,如图2所示,包括以下步骤:

步骤1,通过高分辨率遥感图像处理程序打开高分辨率遥感图像;

步骤2,根据实际地物分布和分类类别数,在高分辨率遥感图像上利用样区工具选择训练样本21、22,将训练样本存入训练样本库;

步骤3,利用兴趣点检测算子在训练样本上检测感兴趣区域;

具体实施时,检测算子可以使用均匀网格,随机采样或是Lowe提出的DoG检测子等。注意这里用“区域”表示一个像素的集合,即任意的图像子集。

步骤4,在检测到区域上提取局部特征,得到局部特征矢量23,所有区域上得到的局部特征矢量构成局部特征矢量集合,将局部特征矢量集合存入特征库;

步骤5,用多维金字塔表达方法将局部特征矢量集合转化成一个表达矢量24,并存入特征表达库,对每个局部特征矢量集合完成多维金字塔表达需要以下几个步骤:

步骤5.1,利用降维方法,将局部特征矢量降维;

步骤5.2,选择降维后的特征的第一维;

步骤5.3,在该维数据上计算金字塔表达矢量;

步骤5.4,选择降维后的特征的下一维,重复步骤5.3,直到在所有维上完成金字塔表达矢量的计算;

步骤5.5,将各维得到的金字塔表达矢量连接起来构成一个多维金字塔表达矢量。

步骤6,选择下一训练样本,重复步骤3到步骤5,直到完成所有训练样本的表达,得到完整的特征表达库。

步骤7,将属于第一类的表达矢量标记为正样本,所有不属于该类的表达矢量标记为负样本。

步骤8,输入AdaBoost中训练强分类器25,利用AdaBoost训练强分类器26需要以下几步:

(Adaboost是本领域公知的分类器学习方法,在此不予赘述。)

步骤8.1,假设一共有N个正负样本,每个样本的权重为1/N,迭代次数t=1。

步骤8.2,取正负样本的第一维的数据,将所有数据按照大小排列;

步骤8.3,取第一个值和第二个值的中值,作为门限。

步骤8.4,统计利用此门限区分正负样本的误差率;

步骤8.5,取下一对相邻值的中值作为门限,重复步骤8.4,直到计算出所有门限下的分类误差率;

步骤8.6,取分类误差率最小的门限和此时两个类别相对门限的方向作为该维选择的弱分类器;

步骤8.7,取正负样本的下一维数据,将所有数据按照大小排列,重复步骤8.3到步骤8.6,直到所有维的弱分类器计算完毕;

步骤8.8,选择分类误差率最小的弱分类器,作为最佳弱分类器ht(x);

步骤8.9,通过以下公式计算ht(x)的权重,

αt=12log1-ϵtϵt

其中,εt为ht(x)的分类误差率。

步骤8.10,通过以下公式更新所有样本的权重:

dnt+1=dntexp{-αtynht(xn)}/Zt

其中,yn是样本的标号,Zt是使Σn=1Ndnt+1=1的归一化常量。

步骤8.11,t=t+1,重复步骤8.2到步骤8.10,直到满足以下任意一个条件:(1)εt=0;(2)ϵt12;(3)t大于设定值。

步骤8.12,通过以下公式计算输出的强分类器:

f(x)=Σt=1TαtΣr=1Tαrht(x)

步骤9,将属于下一类的样本标记为正样本,所有不属于该类的样本标记为负样本。重复步骤8,直到完成所有类别的强分类器的训练;

步骤10,将待分类高分辨率遥感图像27分解为图像子块28;

步骤11,对一个图像子块重复步骤3到步骤5,但仅计算强分类器需要用到的多维金字塔表达矢量的特征维的取值,得到该图像子块的表达矢量29、30。

步骤12,将图像子块的表达矢量输入各类的强分类器中31,计算该表达矢量属于各类的概率;

步骤13,选择概率最大的那个类别作为图像子块的类别32;

步骤14,将子块的类别赋予该子块覆盖的所有像素;

步骤15,选择下一图像子块,重复步骤11到步骤14,直到完成待分类遥感图像的所有像素的分类33;

本实施例将本发明所提供技术方案应用在高分辨率SAR图像分类中。

(1)利用图像处理工具,打开一幅大小为20000×20000像素的高分辨率SAR图像。该图像是TerraSAR-X拍摄的加拿大多伦多市某处。

(2)该图像上大致包括非人工建筑、人工建筑公共场所和住宅区3类地物。根据实际地物分布,在该图像上利用样区工具选择训练样本,将训练样本存入训练样本库,每类选择100幅训练样本,共300幅训练样本构成训练样本库,每张图像的大小为128×128像素。

(3)在每张训练样本上划分均匀网格,网格大小为16×16像素,网格间重叠50%,共得到225个感兴趣区域。

(4)在每个网格上提取32维直方图作为局部特征,这个直方图可以通过将16位数据的直方图均匀量化后得到。每张图像由225个32维矢量构成的局部特征矢量集合描述。

(5)使用PCA将32维局部特征矢量集合降为4维特征矢量集合,在每一维计算5层金字塔表达矢量,再将各维得到的金字塔表达矢量连接起来构成多维金字塔表达矢量,得到的多维金字塔表达矢量的维数是85。

(6)在训练样本库的所有训练样本上完成(3)到(5)的操作。

(7)训练第一类的分类器,所有属于第一类的训练样本标记为正样本,所有不属于第一类的训练样本标记为负样本。

(8)AdaBoost迭代100次并使用决定树作为弱分类器训练强分类器。

(9)共得到3个强分类器。

(10)待分类的是另一张大幅的高分辨率SAR图像,图像大小为1680×1984像素,分辨率为1.25米。将待分类SAR图像分成128×128像素的图像子块(与不重叠的子块相比,重叠的子块得到的分类结果更容易消除锯齿形边界,并且也可以利用分割方法得到不规则的图像子块,这里为了简化计算使用不重叠的规则子块)。

(11)在每个子块上划分大小为16×16像素的网格,网格间重叠50%。在每个网格上提取32维均匀量化后的直方图。每个图像子块由225个32维的特征矢量构成的集合描述。由于在(8)中AdaBoost已经选定了用于分类的特征维,此时不需要每个图像子块的多维金字塔表达矢量的所有维,而仅仅计算该图像子块的多维金字塔表达矢量在AdaBoost选定的特征维上对应的值即可。

(12)将得到的选定特征维上的值分别输入3个强分类器中,得到该图像子块分别属于三个类别的概率,取其中概率最大的那个强分类器对应的类别作为该图像子块的类别,即图像子块的类别为G(MP(X))=argmaxy∈Yfy(MP(X))。

(13)将子块的类别赋予该子块的所有像素。

(14)将图像上所有图像子块都按上述操作计算类别后赋予其所覆盖的像素,得到最终的分类结果图,完成分类。

实例中的分类结果表明,本发明中提出的针对高分辨率遥感图像复杂类别的分类方法能得到较高的分类精度,尤其是当局部特征是高维特征时,不仅计算效率高而且保证较好的分类精度。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号