首页> 中国专利> 街区式农村居民地遥感快速标注方法

街区式农村居民地遥感快速标注方法

摘要

本发明公开了一种街区式农村居民地遥感快速标注方法,其包括:获取待标注的遥感影像,并将遥感影像划分成若干影像块;按设定的约束条件将影像块初步标注为居民地影像块和非居民地影像块;获取若干初步标注的非居民地影像块作为负样本和一个手工标注的影像块作为正样本,采用最近邻分类法选取设定数量的影像块作为正样本;采用正样本、负样本和若干特征,运用k‑近邻分类法,逐步剔除居民地影像块中的非居民影像块;将空间具有邻接农村居民地影像块的农村居民地影像块聚集在一起形成若干聚集居民地影像块,判断聚集居民地影像块中农村居民地影像块个数是否小于设定值,如果小于则将聚集居民地影像块加入负样本,否则输出相应的聚集居民地影像块。

著录项

  • 公开/公告号CN106886609A

    专利类型发明专利

  • 公开/公告日2017-06-23

    原文格式PDF

  • 申请/专利权人 中国科学院地理科学与资源研究所;

    申请/专利号CN201710204859.8

  • 发明设计人 杨晓梅;陆尘;周成虎;

    申请日2017-03-31

  • 分类号G06F17/30;G06K9/20;G06K9/38;G06K9/46;G06K9/62;

  • 代理机构成都正华专利代理事务所(普通合伙);

  • 代理人李蕊

  • 地址 100101 北京市朝阳区大屯路甲11号

  • 入库时间 2023-06-19 02:37:14

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-03-10

    未缴年费专利权终止 IPC(主分类):G06F16/58 专利号:ZL2017102048598 申请日:20170331 授权公告日:20191231

    专利权的终止

  • 2019-12-31

    授权

    授权

  • 2017-07-18

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20170331

    实质审查的生效

  • 2017-06-23

    公开

    公开

说明书

技术领域

本发明涉及遥感影像中居民地的标注技术,具体涉及一种街区式农村居民地遥感快速标注方法。

背景技术

随着遥感影像空间分辨率的不断提升,遥感影像提供了更多的几何、纹理、形状等细节信息,居民地的内部组成、外部轮廓能够更好地展现在遥感影像上,利用遥感手段精确获取居民地空间分布信息成为可能。但是,居民地内部由建筑物、道路、绿地、阴影等构成,不同组成的光谱差异较大,仅利用光谱信息难以提取居民地信息,居民地在高分影像上的表现形式加大了遥感自动提取算法的技术难度。为解决这一技术难题,服务灾害评估、环境变化、军事侦察等领域的应用需求,国内外研究学者对高分遥感影像居民地信息提取算法进行了研究。

目前已有的高分遥感影像居民地信息提取算法主要存在以下两个问题:第一,基于监督分类机制的算法需要大量手工标注的训练样本,标注过程繁琐耗时,算法的自动化程度无法达到实用级别;第二,基于非监督机制的算法虽然不需要训练样本,但其分类精度相对较低,需要进一步提升。由此可见,克服监督分类算法和非监督分类算法的缺点,构建不需要训练样本或少量训练样本,且提取准确率较高的遥感影像居民地信息快速提取算法,是当前值得深入研究的问题。

发明内容

针对现有技术中的上述不足,本发明提供的街区式农村居民地遥感快速标注方法能够准确地检测到遥感影像中的居民地。

为了达到上述发明目的,本发明采用的技术方案如下。

提供一种街区式农村居民地遥感快速标注方法,其包括以下步骤:

获取待标注的遥感影像,并将所述遥感影像划分成若干影像块,相邻影像块之间存在部分重叠;

按设定的约束条件将影像块初步标注为居民地影像块和非居民地影像块;

获取若干初步标注的非居民地影像块作为负样本和一个手工标注的影像块作为正样本,在距离正样本设定距离内的区域中,采用最近邻分类法选取设定数量的影像块作为正样本;

采用正样本、负样本和若干特征,运用k-近邻分类法,依次利用每一个特征训练分类器,逐步剔除居民地影像块中的非居民影像块,得到采用最后一个特征剔除后的农村居民地影像块;

将空间具有邻接农村居民地影像块的农村居民地影像块聚集在一起形成若干聚集居民地影像块,判断聚集居民地影像块中农村居民地影像块个数是否小于设定值,如果小于则将该区域内的影像块加入到负样本中,否则输出相应的聚集居民地影像块。

进一步地,优选若干特征包括光谱、纹理和形状特征,逐步剔除居民地影像块中的非居民影像块时,按设定顺序采用每个特征剔除初步标注为居民地影像块中非居民用地,采用设定顺序前两个特征剔除非居民用地后,均需对具有邻接居民地影像块的影像块进行聚集形成聚集块,并将聚集块中居民地个数小于设定值的聚集块加入到负样本中;设定顺序中的第二个和第三个特征均采用上一个特征剔除后得到的居民用地进行判断。

进一步地,优选所述影像块为正方形影像块,将所述影像块等分成四个正方形子影像块;

判断以任意子影像块为中心的四个农村居民地影像块的个数是否大于等于预设值,若大于等于预设值,则子影像块为居民地,并输出为居民地的子影像块。

进一步地,采用预设的约束条件将影像块初步标注为居民地和非居民地的具体方法为:

计算每个影像块中每个像素的窗口方差,并判断所有像素的窗口方差小于等于设定阀值的占比是否大于等于预设阀值;若大于等于,则剔除该影像块;

对余下影像块采用canny算子提取遥感影像的边缘,并判断每个影像块内水平方向上连续的边缘像素个数与垂直方向上连续的边缘像素个数的比值是否位于设定范围内,若不在设定范围内,则剔除该影像块;

判断余下的影像块内整行和整列像素都不包含边缘像素的数目,若行数目和列数目中任一值大于影像块尺寸的一半,则剔除该影像块;

计算余下的影像块中每个影像块的灰度累积直方图,并判断像素灰度值位于设定区间内的比例是否大于设定值,若大于设定值,则剔除该影像块;

将剔除的影像块归类为初步标注的非居民地影像块,余下的影像块归类为初步标注的居民地影像块。

进一步地,优选所述设定区间为[0,d1]或区间[d2,∞],所述d1和d2的获取方法为:

计算手工标注的影像块的灰度累积直方图;

采用以下公式计算d1和d2

s.t.H(i)>25%×w2

s.t.H(i)>75%×w2

其中,H(i)为手工标注的影像块的灰度值为i时的累积像素数,w为影像块的边长。

进一步地,优选所述依次利用每一个特征训练分类器,逐步剔除居民地影像块中的非居民影像块进一步包括:

选取相同数量的正样本和负样本构建成样本集,之后,构建若干分类器;

分类器运用k-近邻分类法,计算初步标注为居民地的影像块及样本集的光谱、纹理和形状特征,在样本集中搜索单个居民地影像块前k个近邻;

若至少一半分类器确定前k个近邻中判定当前初步标注为居民地影像块的概率小于为非居民地影像块的概率,则将当前初步标注为居民地的影像块归类为非居民地。

进一步地,优选在最近邻分类法中采用欧氏距离选选取设定数量的影像块作为正样本,正样本的选取过程进一步包括:

以灰度直方图为影像块特征,以欧氏距离衡量特征间的差异,计算距离手工标注的正样本设定距离内的所有影像块与正样本和所有的负样本之间的欧氏距离;

若每个影像块的所有欧氏距离中距离正样本的欧氏距离为最小值,则将其标注为正样本,直至正样本数量达到设定数量。

进一步地,优选当距离手工标注的正样本设定距离内的正样本小于设定数量时,以灰度直方图为影像块特征,计算初步标注为居民地的影像块与手工标注的正样本之间的欧氏距离,选取欧氏距离较小的影像块补足设定数量的正样本。

进一步地,优选所述正样本的数量q与负样本的数量Q的关系为Q=nq,n为单数。

进一步地,优选所述遥感影像为高分二号全色影像。

本发明的有益效果为:本方案在进行街区式居民地的标注时,仅需一个人工标注的样本,不需要提供大量人工标注的数据样本,降低了标注过程的繁琐程度,面对海量级的遥感影像数据,保证了街区式农村居民地标注的自动化和实时化需求。

采用本方法进行居民地标注,可以高效、准确地检测到影像中的居民地,对地物背景存在差异的遥感影像都具有良好的效果;将本方法的标注结果与人工标注的结构相比,不存在将一大块非居民地区域误判为居民地的情况,总体上能够达到手工标注的精度。

附图说明

图1为街区式农村居民地遥感快速标注方法一个实施例的流程图。

图2为遥感影像的多种划分方式的示意图。

图3为两种不同划分方式的影像块重叠后的示意图。

图4为两种不同划分方式的影像块重叠后的局部分块示意图。

图5为搜索正样本方式的示意图。

图6为采用本方案的方法进行街区式农村居民地标注后的遥感影像图。

图7为采用现有的基于边缘抑制点投票的高分辨率遥感影像农村居民地提取算法进行街区式农村居民地标注后的遥感影像图。

图8为采用手工标注方法进行街区式农村居民地标注后的遥感影像图。

具体实施方式

下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。

参考图1,图1示出了街区式农村居民地遥感快速标注方法一个实施例的流程图;如图1所示,该方法100包括步骤101至步骤105。

在步骤101中,获取待标注的遥感影像,并将遥感影像划分成若干影像块(本方案的影像块的窗口边长选为w个像素),相邻影像块之间存在部分重叠;实施时,本方案选用的遥感影像为高分二号全色影像。

在步骤102中,按设定的约束条件将影像块初步标注为居民地影像块和非居民地影像块。

在本发明的一个实施例中,采用设定的约束条件(本方案设定的约束条件包括四个,分别是约束条件1、约束条件2、约束条件3和约束条件4)将影像块初步标注为居民地和非居民地的具体方法为:

约束条件1:计算每个影像块中每个像素的窗口方差,并判断所有像素的窗口方差小于等于设定阀值的占比是否大于等于预设阀值;若大于等于,则剔除该影像块。

其中,对于处在影像块中第i行、第j列的像素(i,j),其窗口方差v(i,j)的计算公式为:

式中,W为窗口的边长,g(i,j)为像素(i,j)的灰度值。

设定阀值的计算方法为:选取单个手工标注的影像块,计算该手工标注的影像块的窗口方差的累积直方图H,则设定阀值T的计算公式为:

s.t.H(i)>10%×w2

其中,H(i)为灰度值为i时的累积像素数,w为影像块B的边长。将预设阀值设置得尽可能高,可进一步保证被排除的影像块不是居民地,故本方案中的预设阀值设置为95,在计算窗口方差的过程中,窗口边长W设置为5。

约束条件2:对余下影像块(约束条件1剔除后剩下的影像块)采用canny算子提取遥感影像的边缘,并判断每个影像块内水平方向上连续的边缘像素个数与垂直方向上连续的边缘像素个数的比值是否位于设定范围(设定范围为[1/R,R],其中R的取值优选为3.5)内,若不在设定范围内,则剔除该影像块。

水平方向上连续的边缘像素rcn数的计算公式为:

垂直方向上连续的边缘像素数ccn的公式分别为:

式中,e(i,j)为canny算子的边缘提取结果,若像素(i,j)为边缘像素,则e(i,j)取值为1,否则e(i,j)取值为0,I为指示函数,若符合条件则函数值为1,否则取值为0,w为影像块B的边长。

约束条件3:判断余下的影像块(约束条件2剔除后剩下的影像块)内整行和整列像素都不包含边缘像素的数目,若行数目和列数目中任一值大于影像块尺寸的一半,则剔除该影像块。

实施时,计算余下的影像块内整行像素都不包含边缘像素的行数目rfn的公式分别为:

计算余下的影像块内整列像素都不包含边缘像素的列数目rfn的公式分别为:

式中,e(i,j)为canny算子的边缘提取结果,I为指示函数,w为影像块B的边长。

约束条件4:计算余下的影像块(约束条件3剔除后剩下的影像块)中每个影像块的灰度累积直方图,并判断像素灰度值位于设定区间内的比例是否大于设定值(本方案优选设定值选取90),若大于设定值,则剔除该影像块。

在本发明的一个实施例中,设定区间为[0,d1]或区间[d2,∞],d1和d2的获取方法为:

计算手工标注的影像块的灰度累积直方图;

采用以下公式计算d1和d2

s.t.H(i)>25%×w2

s.t.H(i)>75%×w2

其中,H(i)为手工标注的影像块的灰度值为i时的累积像素数,w为影像块的边长。

采用上述四个约束条件进行居民地和非居民地划分完成后,将剔除的影像块归类为初步标注的非居民地影像块,余下的影像块归类为初步标注的居民地影像块。

上述采用约束条件进行居民地和非居民地判断时,初步判断为非居民地的影像块就直接排除,再进行下一个约束条件判断时,就直接判断余下的影像块,即在约束条件1中剔除的非居民地影像块就不参与约束条件2的判断,在约束条件1和约束条件2中剔除的非居民地影像块就不参与约束条件3的判断,在约束条件1、约束条件2和约束条件3中剔除的非居民地影像块就不参与约束条件4的判断。

在步骤103中,获取若干初步标注的非居民地影像块作为负样本和一个手工标注的影像块作为正样本,在距离正样本设定距离内的区域中,采用最近邻分类法选取设定数量的影像块作为正样本;

实施时,本方案优选在最近邻分类法中采用欧氏距离选取设定数量的影像块作为正样本,其中,正样本的选取过程进一步包括:

在距离正样本设定距离内的区域中,采用欧氏距离选取设定数量的影像块作为正样本进一步包括:

采用影像块的灰度直方图,在距离手工标注的正样本设定值的范围内,计算所有影像块与手工标注的正样本和所有的负样本之间的欧氏距离;

若每个影像块的所有欧氏距离中距离正样本的欧氏距离为最小值,则将其标注为正样本,直至正样本数量达到设定数量。

下面对正样本的选择进一步细化后进行说明:

首先,从划分为非居民地的影像块中随机选取q个影像块作为负样本,选取手工标注的单个居民地影像块为正样本;然后,利用单个正样本的邻域影像块进行正样本的初步扩充;最后,从初步划分为居民地影像块中进一步选取正样本。

从距离当前正样本两个影像块尺寸的影像块处开始搜索其他正样本,如图5所示。图5中黑色影像块为人工标注的正样本,灰色影像块为起始搜索影像块。以当前正样本和负样本为基础,运用最近邻分类方法对灰色影像块进行分类。具体地,计算影像块的灰度直方图h作为影像块特征,以欧氏距离来衡量直方图之间的相似性,n表示灰度级的数量。

设起始影像块Bl的灰度直方图为hl,当前样本集为S={(h1,c1),(h2,c2),...,(hQ+1,cQ+1)},其中第一个样本为正样本,其类标记c1为1,其余样本为负样本,其类样本标记为0。对起始影像块Bl,求样本集S中与直方图hl距离最近的样本h’,其对应的类别为c’,即:

则将起始影像块Bl决策为c’类,如果起始影像块被分类为非居民地,则按图5中箭头方向移动影像块,直至影像块被分类为居民地。使用该方法进行正样本选取,对人工标记的正样本没有位置要求,也保证了正样本间存在一定差异。

在选定邻域正样本之后,如果距离手工标注的正样本设定距离内的正样本小于设定数量时,计算初步标注的居民地中影像块的灰度直方图与手工标注的正样本之间的欧氏距离,选取欧式距较小的影像块补足设定数量的正样本。

在步骤104中,采用正样本、负样本和若干特征,运用k-近邻分类法,依次利用每一个特征训练分类器,逐步剔除居民地影像块中的非居民影像块,得到采用最后一个特征剔除后的农村居民地影像块。

实施时,依次利用每一个特征训练分类器,逐步剔除居民地影像块中的非居民影像块进一步包括:

选取相同数量的正样本和负样本构建成样本集,之后,构建若干分类器;

分类器运用k-近邻分类法,计算初步标注为居民地的影像块及样本集的光谱、纹理和形状特征,在样本集中搜索单个居民地影像块前k个近邻;

若至少一半分类器确定前k个近邻中判定当前初步标注为居民地影像块的概率小于为非居民地影像块的概率,则将当前初步标注为居民地的影像块归类为非居民地。

逐步剔除居民地影像块中的非居民影像块的具体算法可以进一步采用以下方式进行细化:在提取了影像块的特征(光谱、纹理及SIFT特征)之后,依次运用光谱、纹理及SIFT特征,在自动选取的正负样本的支持下,对初步判定为居民地影像块进行分类,剔除其中的非居民地影像块。

运用单个特征进行剔除非居民地影像块的步骤为:

(1)从非居民地影块中,随机地选取Q个影像块为负样本集。正样本的数量q与负样本的数量Q满足关系Q=nq,n为单数。增加n的值,可使训练样本中包含更多负样本。

(2)构建n个分类器,对居民地影像块进行判断。对于影像块B,如果将其判定为居民地的分类器的个数大于n/2,则将该影像块B判定为居民地。构建单个分类器时,在负样本集中选取q个负样本集,与q个正样本一起构成样本集D。设待判定影像块Bt的特征为ht,当前样本集为S={(h1,c1),(h2,c2),L,(hN,cN)},其中N=2q。对影像块Bt,求其在样本集D中的前k个近邻,设其中有k1个样本属于居民地,k2个样本属于非居民地。如果属于居民地的近邻样本数k1大于属于非居民地的近邻样本数k2,则判定影像块Bt为居民地;否则判定影像块Bt为非居民地。在分类器中,使用欧氏距离衡量特征间的差异。

在步骤105中,将空间具有邻接农村居民地影像块的农村居民地影像块聚集在一起形成若干聚集居民地影像块,判断聚集居民地影像块中农村居民地影像块个数是否小于设定值,如果小于则将该区域内的影像块加入到负样本中;否则输出相应的聚集居民地影像块。

在逐步剔除居民地影像块中的非居民影像块时,按设定顺序采用每个特征剔除初步标注为居民地影像块中非居民用地,采用设定顺序前两个特征剔除非居民用地后,均需对具有邻接居民地影像块的影像块进行聚集形成聚集块,并将聚集块中居民地个数小于设定值的聚集块加入到负样本中;设定顺序中的第二个和第三个特征均采用上一个特征剔除后得到的居民用地进行判断。

下面对进行居民地聚集的方法进行进一步说明:

搜索邻接居民地,生成聚集居民地影像块R,计算居民地影像块R中包含规则影像块的个数m,如果个数m小于一定的阈值T,则将影像块R所在的区域加入到负样本集中。由于街区式农村居民地具有一定的规模,居民地区域由一定量的影像块组成。由较少影像块B构成的大居民地影像块R有很高可能性是非居民地,且个数m越小属于非居民地的概率就越高,本方案中T取8。

从单个农村居民地影像块Bt出发,将空间上邻接的农村居民地影像块Bn,加入到聚集居民地影像块Rt中,然后进一步从邻接农村居民地影像块Bn出发,将更多的邻接农村居民地影像块加入到Rt。重复这一过程,直至Rt中没有新的邻接居民地影像块加入;

按此方式,从没有被划定到当前聚集居民地影像块的农村居民地影像块出发,搜索其邻接的农村居民地影像块,直到所有的农村居民地影像块的邻接农村居民地影像块都已加入到相应的聚集居民地影像块中;

最后,计算每一个聚集居民地影像块Rt中包含农村居民地影像块的个数m。

为了进一步提高农村居民地影像块就是居民地的准确性,在实施时,本方案优选影像块为正方形影像块,将影像块等分成四个正方形子影像块;

判断以任意子影像块为中心的四个农村居民地影像块的个数是否大于等于预设值,若大于等于预设值,则子影像块为居民地,并输出为居民地的子影像块。

下面对遥感影像中影像块的划分进行说明:

如图2所示,以正方形影像块为单位,对居民地进行标注。设窗口边长为w个像素,对遥感影像进行有重叠的方式进行划分:

以遥感影像左上角为原点,分别从点(0,0)、(w/2,0)、(0,w/2)、(w/2,w/2)出发,在水平方向上和垂直方向上以步长w对窗口进行移动,记录完全落在影像中的窗口所在的影像块B。对遥感影像进行划分的方式如图2所示。

将图2中(a)和(d)中的划分结果进行叠合,得到如图3所示的分块方式。同样将图2中(b)和(c)中的划分结果进行叠合,也得到如图3所示的分块方式。因而,按上述方式对遥感影像进行划分后,遥感影像可视为划分为w/2的正方形影像块b,影像块b之间没有重叠,本方案中提到的影像块为w的正方形影像块,子影像块为w/2的正方形影像块。

如图4所示,相邻的四个边长为w/2子影像块bi-1,j-1、bi,j-1、bi-1,j、bi,j构成大影像块B。其中,子影像块bij是四个影像块B1={bi-1,j-1、bi,j-1、bi-1,j、bi,j}、B2={bi,j-1、bi+1,j-1、bi,j、bi+1,j}、B3={bi-1,j、bi,j、bi-1,j+1、bi,j+1}、B4={bi,j、bi+1,j、bi,j+1、bi+1,j+1}的公共部分。若影像块B1、B2、B3、B4中有大于1个块为农村居民地影像块,则将子影像块bij判定为居民地影像块。

在本发明的一个实施例中,影像块光谱特征选取的是灰度直方图,影像块纹理特征选择的是窗口方差直方图,直方图区间的大小一致,区间的个数为64。影像块形状特征选择选取的SIFT(Scale-invariant feature transform)特征。SIFT算法由特征点提取和特征点描述两个过程构成。

本方案采用SIFT特征提取算法时,省略特征点提取这一过程,直接以尺寸为16×16的子块的中心点为特征点,对中心点进行特征描述,产生一个128维的特征。由于采用了SIFT特征,则居民地提取影像块B的边长至少为16个像素。本方案将居民地提取影像块B的边长w设为16的m倍,然后对影像块B进行无重叠的划分,划分成m2个边长为16×16的子块并提取SIFT特征s。单个SIFT特征的维数为128,如果对m2个128维特征进行连接,则得到的特征维数过大。设提取的SIFT特征为si,i=1,2,…,m2,按下式对si进行融合得到影像块的SIFT特征Si

式中为特征sj的第i维分量。

下面结合现有技术中的现有的基于边缘抑制点投票的高分辨率遥感影像农村居民地提取算法(以下简称对比算法)和人工手动标注对本方案的标注方法的效果进行说明:

在进行试验时,本方案将居民地标注单元的尺寸w设置为32,正样本数q设置为50,负样本数据设置为450,也即在进行居民地精分类时训练9个分类器,每个分类器中选择11个最近邻来判断是否为居民地。本方案的标注结果、对比算法提取结果及手工提取结果分别参考图6至图8所示,图6至图8中白色线条标注的区域为街区式农村居民地。

从图6至图8可以看出,在面对不同的背景地物类型,本方案的标注方法标注的居民地区域总体符合手工标注的结果,且不存在将一大块非居民地区域误判为居民地的情况,能够有效的将街区式农村居民地从遥感影像上提取出来。

进一步采用20幅遥感影像计算本方案的标注方法与对比算法的准确率与虚警率,以定量地评价本方案算法的提取性能,本方案的平均准确率和虚警率分别为92.34%和2.73%;对比算法的平均准确率和虚警率分别为92.52%和3.52%。

由此可见,本方案的标注算法与对比算法的准确率处于同一水平,但本方案的标注算法的虚警率更低,标注结果中有较少非居民地区域被误判为居民地。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号