首页> 中国专利> 一种基于OpenStreetMap的遥感影像多特征联合分类方法

一种基于OpenStreetMap的遥感影像多特征联合分类方法

摘要

本发明公开了一种基于OpenStreetMap的遥感影像多特征分类方法,本发明从遥感影像中提取多种空间特征描述影像不同方面的特性,采用形态学腐蚀滤波去除对象边界混淆像素,针对每个类别进行类内的聚类分析,去除错误标记,获取准确的分类样本,联合获取的影像特征与分类样本,并结合支持向量机分类器,计算各个像素在不同特征下属于不同类别的概率,结合分类可靠性实现不同特征对应的类别概率的加权融合,完成遥感影像分类。本发明通过挖掘遥感影像的空间信息,有效地整合了多种经典空间特征提取算法,能够增强不同类别的可分性,获得更准确的各类别分类结果和更高的分类精度。

著录项

  • 公开/公告号CN109063754A

    专利类型发明专利

  • 公开/公告日2018-12-21

    原文格式PDF

  • 申请/专利权人 武汉大学;

    申请/专利号CN201810792087.9

  • 发明设计人 卢其楷;万太礼;

    申请日2018-07-18

  • 分类号G06K9/62(20060101);G06K9/00(20060101);

  • 代理机构42222 武汉科皓知识产权代理事务所(特殊普通合伙);

  • 代理人王琪

  • 地址 430072 湖北省武汉市武昌区珞珈山武汉大学

  • 入库时间 2023-06-19 07:52:37

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-07-08

    未缴年费专利权终止 IPC(主分类):G06K 9/62 专利号:ZL2018107920879 申请日:20180718 授权公告日:20200807

    专利权的终止

  • 2020-08-07

    授权

    授权

  • 2019-01-15

    实质审查的生效 IPC(主分类):G06K9/62 申请日:20180718

    实质审查的生效

  • 2018-12-21

    公开

    公开

说明书

技术领域

本发明涉及遥感影像处理技术领域,特别涉及一种多特征联合分类方法,尤其是一种基于OpenStreetMap的遥感影像多特征联合分类联合方法。

背景技术

随着WEB 2.0的发展,公众不仅可以从因特网上获取知识,还可以将自己的知识和经验上传到因特网上,与其他人共享信息。其中,由公众贡献的带有地理位置的信息被称为自发地理信息(Volunteered Geographical Information,VGI)。其中,OpenStreetMap(OSM)是一个最典型的VGI项目,其目标在于集公众的力量绘制开源免费的世界地图,并最终为公众服务。公众使用便携GPS设备记录轨迹作为测量的手段,也可以根据对当地的认知,以Bing影像作为底图进行制图。

近年来,研究者将OSM数据应用于遥感影像分类,并取得了较好的效果。遥感影像是研究地表覆盖、感知地球变化的重要数据来源,能够反映地表的覆盖情况。随着成像元件和技术的发展,遥感影像的空间分辨率越来越高,提供了更加细节的地表空间结构信息,为对地观测提供了更准确的数据支撑。其中,分类技术结合训练样本和影像特征,能够自动判断影像上的未标记样本的类别信息,是遥感影像信息解译的重要手段。然而,通过实地调查标记样本的方法耗时耗力,无法快速获得足量的训练样本。OSM能够为遥感影像分类提供大量的训练样本,能够有效地降低专家工作量,为遥感影像分类样本快速获取提供了新的途径。

现有的方法从OSM数据中的标记信息提取分类样本,根据像素的光谱特征进行影像分类。然而,受限于OSM的数据获取方式,其数据质量在不同区域存在较大的差异。在一些公众参与度高的地区,特别是部分发达国家,OSM的数据已经相当丰富,数据质量堪比专业机构生产的数据。然而,受限于公众的参与程度,大部分地区的数据量有限,并在空间位置和类别属性方面存在一定的误差,直接使用OSM作为训练样本难以适应复杂的遥感影像场景。同时,当前基于OSM的遥感影像分类方法通常是基于影像的光谱特征,未能有效利用到遥感影像丰富的空间结构信息。由于遥感影像地物属性的复杂性,基于影像光谱的分类方式难以准确对像素的类别进行预测。挖掘影像上的地物空间分布特点,获取空间信息,能够有效弥补光谱特征的不足,有利于提升遥感影像分类精度。然而,单一空间特征难以全面反映不同地物的空间结构特点,多特征联合分类的方式能够有机地结合不同特征的优势,获得比单一特征更好的结果。当前多特征融合的方式,往往是通过向量叠加形成更高维度的特征输入分类器进行解译,未能考虑到不同特征对于分类结果的贡献,不利于分类精度的进一步提升。

发明内容

针对现有工作中存在的问题,本发明提供一种基于OpenStreetMap的遥感影像多特征联合分类方法,该方法从OSM中提取地物标记信息用于分类样本生成,采用形态学处理、样本聚类手段,减少OSM中的错误标记,获取准确可靠的分类样本,从遥感影像中提取多种特征描述地物空间分布,获取不同特征对应的分类结果,依据类别概率输出计算不同分类结果的可靠性,加权融合多个特征对应的分类结果,完成遥感影像的分类。

本发明的技术方案为一种基于OpenStreetMap的遥感影像多特征分类方法,包含以下步骤:

1)将OpenStreetMap(OSM)与待分类遥感影像进行配准,根据实际分类需求,从OSM中选择出感兴趣类别对应的矢量图层,将其转化为栅格影像;

2)提取待分类遥感影像多种不同空间特征,从多个方面描述待分类遥感影像地物分布特点;

3)对各个类别对应的OSM栅格影像进行形态学处理,以获得去除目标边缘像素保留中心像素的样本;

4)针对每个类别的样本,使用聚类算法根据像素的特征进行聚类分析,并根据每个子类聚类中心的分布及每个子类中的样本数,剔除被错误标记的样本,

5)利用获取的样本,分别使用多种不同空间特征并结合支持向量机对待分类遥感影像进行分类,获取每个像素在不同空间特征下属于不同类别的概率;

6)根据输出的类别概率,计算各个分类结果的可靠性,并以此为基础,对多个分类结果的输出结果进行加权融合,获得最后的分类结果。

进一步的,步骤1)中,获得的栅格影像的空间分辨率与待分类遥感影像空间分辨率一致。

进一步的,步骤2)中,利用灰度共生纹理(Gray-Level Co-occurrence Matrix,GLCM)提取遥感影像多元化空间纹理信息;利用形态学轮廓(Morphological Profiles,MPs)提取遥感影像空间结构信息;利用多指数特征(Multi-Index Feature,MIF)的提取遥感影像复杂场景,包括房屋指数,阴影指数,和植被指数,联合上述3种不同空间特征的互补信息,解决单一空间特征难以全面表达影像空间信息的问题。

进一步的,步骤3)中,获得去除目标边缘像素保留中心像素的样本的实现方式如下,

每一幅栅格图像可以视为一个二类标记图,属于该类别的标记为1,不属于该类别的标记为0;为了去除目标的边界区域,针对每一幅二类标记图进行形态学腐蚀运算,公式如下:

其中,是腐蚀算子,Bx表示图像上位置x为原点的结构元素B,腐蚀结果是结构元素B能够完全包含于A的所有位置x组成的新图像。

进一步的,步骤4)中,采用k-均值算法对每个类别的样本进行聚类分析,k-均值算法计算流程如下:

步骤4.1,从样本集中随机选取M个种子点作为初始聚类中心;

步骤4.2,计算所有样本在特征空间中到各个聚类中心的距离,若样本离第m个聚类中心距离最近,则该样本被划归于第m个聚类中心对应的点群;

步骤4.3,基于获得的M个点群,重新计算每个点群的中心,并作为下一次迭代的聚类中心;

步骤4.4,重复步骤4.3和4.4,直到聚类中心不再发生变化或达到迭代停止条件,从而将样本集聚类为M个子类。

进一步的,步骤4)中,剔除被错误标记的样本的实现方式如下,

统计属于每个聚类子类的样本个数,当某个聚类子类的中心在特征空间距离与其他子类中心间的距离过大,且属于该子类的样本数量过少时,则将该聚类子类删除,具体如下:若第i个类别的样本数为Si,通过k-均值聚类为M个子类;记子类的样本数量为子类中心与最近子类中心的距离为该类别的子类中样本数均值为Sui,标准差为Ssi,变量的均值为Dui,标准差为Dsi,若某一子类满足则认为该子类无效,并将该子类中的样本删除。

进一步的,步骤5)的实现方式如下,

假设待分类遥感影像需分成K种地物类别,利用步骤4)获取的样本,从中选择某一类样本作为正样本,其他所有训练样本视为负样本,构建K个分类器,通过K个SVM分类器和样本的某一特征进行训练,获得K个高维空间的分类超平面,对于像素x,求得其与每一个分类超平面的距离,并使用dk(x)代表其与第k类超平面的距离,从而计算出该像素属于类别k的概率,

其中,Ak控制概率随距离的衰减速度,Bk控制dk(x)原点处的概率截距,两个参数通过最小化样本的原始标记与类别输出间的均方差获得;

利用样本的不同特征代入到K个SVM分类器进行训练,从而获取每个像素在不同特征下属于不同类别的概率。

进一步的,步骤6)的实现方式如下,

(a)根据不同空间特征得到的类别概率输出结果,计算分类结果的可靠性的公式如下:

其中,K代表影像中定义的类别数,对应着降序排列后的概率输出;R(x)取值范围为0到1,较大的R(x)值表示较高的分类可靠性;

(b)使用分类确定性作为不同分类结果的权值,融合不同空间特征对应的类别概率数据结果,获取加权的概率输出:

其中,代表了像素x属于类别k的加权概率,并且满足和Rf(x)分别代表在使用空间特征f的情况下,像素x属于类别k的概率及对应的分类可靠性;

(c)对于每一个像素,选择对应概率最高的类别作为其标记:

其中,C(x)为像素x的类别标记。

本发明与现有技术相比具有以下优势:

1)本发明通过形态学处理和聚类算法,减少了OSM中的错误标记,提升了从OSM获取的分类样本的准确度。

2)本发明通过挖掘遥感影像的空间信息,有效地整合了多种经典空间特征提取算法,能够增强不同类别的可分性,获得更准确的各类别分类结果和更高的分类精度。

3)本发明通过概率加权融合算法,能够有效地集中多种特征的优势,实现影像在不同特征下分类结果的加权融合,整合了不同特征在判别像素上的可靠性。

附图说明

图1为本发明实施例的方法实现流程图。

具体实施方式

下面通过实施例,并结合附图,对本发明的技术方案作进一步具体的说明。

实施例:

步骤1,数据预处理。根据遥感影像的地理位置坐标,选择对应区域的OSM数据。OSM数据有自己的地物类别体系,假设影像分类有K种地物类别(建筑、植被、道路等)的需求,从OSM中提取与影像分类类别对应的数据,共得到K个不同类别的OSM地物图层。提取出来的初始样本保留了OSM的矢量数据格式,需要将其转换成与遥感影像一致的栅格图像格式。

步骤2,多特征提取。本发明使选择了三种经典的空间特征,分别是灰度共生纹理(Gray-Level Co-occurrence Matrix,GLCM)、形态学轮廓(Morphological Profiles,MPs)和多指数特征(Multi-Index Feature,MIF),提取算法描述地物空间分布特点,弥补单一光谱特征的不足。

GLCM是一种基于空间共生矩阵的影像多元化空间纹理信息提取方式,使用不同灰度量化等级衡量影像上下文的光谱相似性,同时用多种空间共生距离,描述不同方向的局部灰度共生关系。影像中不同地物的空间分布对应着不同的灰度共生矩阵,由此获得的统计特征可以描述不同地物的纹理和结构特性。GLCM能够体现具有特定灰度值的像素出现在特定空间关系上的频率,而从灰度共生矩阵中所获取的统计量能够反映该区域内部的像素分布情况及纹理信息,可以表示为fGLCM(w,m),其中,w和m分别代表局部窗口的大小和纹理统计量。选择对比度和同质性作为GLCM统计测度来描述影像的纹理特性。对比度反映了相邻像素的灰度差异,而同质性反映了局部区域中灰度信息的变化,统计测度的表达方式如下:

对比度:

s.t.k=|i-j|

同质性:

其中,g(i,j)代表灰度级为i和j的像素的共生概率,k为灰度级差异的绝对值,Ng代表影像中的灰度量化等级。

MPs是基于数学形态学提出的一种能够反映目标结构形态的特征算法。数学形态学运算可以在保持地物的空间结构属性的同时,滤除影像上具有较小面积的暗目标和亮目标。因此,基于形态学开重构和闭重构,可以提取影像的形态学轮廓特征描述目标的空间结构信息。由于地物在遥感影像上所呈现的多尺度性,在实际应用中通常会采取一系列不同大小的形态学算子对地物进行特征提取。因此,使用具有不同大小的形态学算子对基影像进行开重构和闭重构,可以获得MPs:

其中,γλ(I)和φλ(I)分别代表在针对基影像I使用大小为λ的结构算子时,所获取的形态学开闭运算结果。值得注意的是,当形态学结构算子大小设为0时,所获取的MP等同于原始影像。

MIF旨在利用具有语义信息的较低维度的指数特征代替高维的低层次特征对复杂场景进行描述。采用的指数特征包括房屋指数,阴影指数,和植被指数。

房屋指数:影像上的房屋通常和阴影相邻,使得房屋较之于其周边区域具有更高的亮度值。同时,与其他自然地物相比,房屋形状及大小较为规整,使之更容易被识别。因此,可以通过建立形态学运算与房屋空间光谱特性的联系来获取房屋指数。首先,计算每个像素在可见光波段中的最大响应值作为其对应的亮度值,获取亮度影像,并将其视为房屋指数提取的基准影像。利用预先设定的形态学线性算子,结合形态学顶帽变换处理影像,提取影像中具有局部高亮值的区域:

DMPTH(d,s)={|TH(d,s)-TH(d,s-Vs)|}

其中,TH代表形态学顶帽变换,s和d分别指代形态学线性算子的尺度和方向,Vs是步长。并在此基础上,对不同方向获取的顶帽变换结果取均值,进一步获取房屋指数

其中,Nd和Ns分别是线性算子的方向数和尺度数。在生成的房屋指数影像中,具有较高响应值的区域更可能属于房屋。

阴影指数:阴影指数是房屋指数的孪生算子,因为阴影的光谱特性和房屋完全相反,但两者的空间特性却相似,具体表现为阴影区域局部对比度较高但亮度却很低。因此,阴影指数的构造可以采用与房屋指数相对偶的形态学操作来完成。房屋算子用顶帽变换的形态学轮廓序列,突出影像中的亮目标,而阴影指数则用黑顶帽变换,标注暗目标。阴影算子对应的计算方式如下:

其中,BTH代表形态学黑顶帽变换,用于突显影像中局部较暗的区域。

植被指数:植被指数用来代表研究区域中所存在的植被区域,如树木、草地等。由于植被区域在近红外波段上具有较高的反射率,而在红光波段上反射率较低。可以根据该物理特性,计算植被指数:

其中,NIR代表近红外波段上的响应值,RED代表红光波段上的响应值。

步骤3,边缘去除。OSM的空间精度问题表现在部分地物边界与实际情况存在一定偏移,而中心区域重叠度相对较高。因此,需要保留OSM地物中间区域,去除边界区域,降低边界噪声对分类结果的影响。由OSM获得的地物标记栅格图像可以视为一个二类图。为了去除目标的边界区域,可以针对每一幅二类标记图进行形态学腐蚀运算,公式如下:

其中,是腐蚀算子,Bx表示图像上位置x为原点的结构元素B,腐蚀结果是结构元素B能够完全包含于A的所有位置x组成的新图像。结合影像空间分辨率选择合适的形态学算子及参数,确保在去除边界错误的同时,能够保留目标中心的样本。

步骤4,聚类分析。OSM中可能存在地物类别跟实际情况不符的错误,步骤3无法去除这些错误样本。错误样本一般具有两个特征:(1)在正确类别的样本中占有较少比例;(2)特征分布与正确类别样本的特征具有明显差异。因此,对于每一类别的样本,采用k-均值算法进行聚类分析,可以获取子聚类中心在特征空间中的位置,并且获取每个样本的子类归属。

k-均值算法是基于聚类中心的一种方式,它通过不断优化聚类中心构建聚类模型,最大的优势在于其计算简单以及时间复杂度较低。假设需要将包含n个样本数据集X={x1,x2,L,xn}划分成M个子集,使得每个子集内部的样本具有较高的相似度,而属于不同子集的样本相似性较低。因此,对样本进行k-均值聚类时,将其划归于离它最近的聚类中心:

其中,t代表第t次迭代,μi是归属于类别ci的所有样本的特征均值。

k-均值算法计算流程如下:

步骤4.1,从样本集中随机选取M个种子点作为初始聚类中心。

步骤4.2,计算所有样本在特征空间中到各个聚类中心的距离,若样本离第m个聚类中心距离最近,则该样本被划归于第m个聚类中心对应的点群。

步骤4.3,基于获得的M个点群,重新计算每个点群的中心,并作为下一次迭代的聚类中心。

步骤4.4,重复步骤4.3和4.4,直到聚类中心不再发生变化或达到迭代停止条件。

统计属于每个聚类子类的样本个数,当某个聚类子类的中心在特征空间距离与其他子类中心间的距离过大,且属于该子类的样本数量过少时,则将该聚类子类删除。具体如下:若第i个类别的样本数为Si,通过k-均值聚类为M个子类;记子类的样本数量为子类中心与最近子类中心的距离为该类别的子类中样本数均值为Sui,标准差为Ssi,变量的均值为Dui,标准差为Dsi,若某一子类满足则认为该子类无效,并将将该子类中的样本删除。

步骤5,影像分类。使用支持向量机(Support Vector Machine,SVM)对影像进行分类。SVM是一种基于结构风险最小化准则的分类器,其基本思想是将样本从低维特征空间通过映射函数转换到高维特征空间,并在高维空间内寻找最优超平面完成对不同类别的区分。假设存在映射函数Φ(g)及包含n个标记样本的训练样本集{(x1,y1),(x2,y2),....(xn,yn),y∈(-1,+1)},则分类模型可以表示为:

f(x)=w·Φ(x)+b

其中,w表示权向量,b代表偏置。为了最大化分类边界并使分类错误最小,从而得到最优的分类超平面,需要求解以下函数:

其中,ξi是松弛变量,而C是惩罚系数。可以使用拉格朗日乘子法将其转化为对偶问题的优化来求解以上函数。故该函数也可以表示为:

其中,αi为拉格朗日乘子向量,K(,)代表核函数。本发明使用径向基函数(RadialBasis>

K(xi,xj)=exp(-γ||xi-xj||2)

其中,γ是RBF核的带宽。SVM的决策函数可以表示为:

对于遥感影像中多类分类问题,使用一对多策略结合多个二类SVM构建多类SVM,从中选择某一类样本作为正样本,其他所有训练样本视为负样本,构建K个分类器。通过K个SVM分类模型,我们可以获得K个高维空间的分类超平面,对于每一个像素,都可以求得其与每一个分类超平面的距离。如果使用dk(x)代表其与第k类超平面的距离,则该像素属于类别k的概率可以表示为:

其中,Ak控制概率随距离的衰减速度,Bk控制dk(x)原点处的概率截距,两个参数可以通过最小化样本的原始标记与类别输出间的均方差获得。本实施例中,两个参数的具体计算可参考文献Probabilistic>

利用样本的不同特征代入到K个SVM分类器进行训练,从而获取每个像素在不同特征下属于不同类别的概率。

步骤6,分类融合。影像的每一个像素在不同特征下,呈现出不同的特性,属于各个类别的概率存在差异,需要将多个分类结果进行有机结合。

首先,结合获得的类别概率,获取不同特征对应分类结果的可靠性:

其中,K代表影像中定义的类别数,对应着降序排列后的概率输出。R(x)取值范围为0到1,较大的R(x)值表示较高的分类可靠性。使用分类确定性作为不同分类结果的权值,融合不同特征对应的类别概率输出结果,获取加权的概率输出:

其中,代表了像素x属于类别k的加权概率,并且满足和Rf(x)分别代表在使用空间特征f(包括步骤2所述的灰度共生纹理、形态学轮廓和多指数特征)的情况下,像素x属于类别k的概率及对应的分类可靠性。对于每一个像素,选择对应概率最高的类别作为其标记

其中,C(x)为像素x的类别标记。

本发明方法与传统方法的精度对比:

本发明方法利用OSM提供的地物类别信息,避免人工标记所消耗的人力物力,能够提升遥感影像自动化解译程度。在资源3号卫星获取的某地区遥感影像上,传统的基于OSM分类方法获得的总体精度为83.54%。在同一数据上,本发明方法获得的总体精度为91.22%,明显优于传统方法获得的精度。其原因为,传统方法仅利用了影像的光谱信息,并未考虑OSM数据中错误标记对分类结果的影响。本发明方法通过多特征联合分类的方式对地物进行识别,利用空间特征增强光谱相似地物的可分性,并结合形态学滤波及聚类分析提升样本的可靠性与准确性,有利于分类模型的构建。

本文中所描述的具体实施例仅对本发明精神进行举例署名。本发明所述技术领域的技术人员可对所描述的具体实施例做修改或补充,但不会偏离本发明的精神或超越所附权利要求书所定义的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号