首页> 中国专利> 一种融合多源数据的遗传分类算法

一种融合多源数据的遗传分类算法

摘要

本发明公开了一种融合多源数据的遗传分类算法,通过编码、种群初始化、构建适应度函数和遗传过程等步骤获得遗传进化后的种群,本算法以城市群为研究对象,通过结合三种遥感数据:VIIRS DNB、NDVI和NDBI,重新构建遗传算法的适应度函数,通过改进的遗传算法计算出最优阈值,能客观、快速、准确的获得城乡分类结果。

著录项

  • 公开/公告号CN107944477A

    专利类型发明专利

  • 公开/公告日2018-04-20

    原文格式PDF

  • 申请/专利权人 北京师范大学;

    申请/专利号CN201711127403.2

  • 发明设计人 陈云浩;李康宁;李京;

    申请日2017-11-15

  • 分类号

  • 代理机构北京京万通知识产权代理有限公司;

  • 代理人许天易

  • 地址 100875 北京市海淀区新街口外大街19号

  • 入库时间 2023-06-19 05:05:07

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-07-02

    授权

    授权

  • 2018-05-15

    实质审查的生效 IPC(主分类):G06K9/62 申请日:20171115

    实质审查的生效

  • 2018-04-20

    公开

    公开

说明书

技术领域

本发明涉及一种融合多源数据的遗传分类算法。

背景技术

近年来,全球范围内,城市化进程高速推进,快速城市化影响着全球变化的方方面面,在带来一系列积极变化的同时也产生了许多的环境问题,如城市热岛、城市能耗剧增导致的污染排放问题以及城市生态破坏等。快速、准确、有效地获取城市化时空演变信息对规划城市发展以及解决城市环境问题有重要意义。

遥感技术因其具备进行大面积同步观测的能力、兼顾时效性和经济性等优点可满足城镇扩展研究的需求。高、中分辨率的可见光影像被用于城镇信息提取,但是由于影像成本较高、覆盖范围有限,光谱范围难以区分城市不透水层和乡村独立居民点,可见光遥感数据应用于城镇土地利用覆盖变化的研究受到了一定的限制。

夜间灯光数据能够弥补可见光数据覆盖范围较小、难以区分城乡不透水层的局限性,适用于大范围的城镇信息提取。基于夜间灯光数据提取城镇信息主要分为以下三种方式:分类法、阈值法以及指数法。Cao(2009)提出基于支持向量机分类法,应用DMSP/OLS夜间灯光数据和SPOT-VGT数据提取城市信息,分类法由于应用阈值选择训练样本,样本的选择要求一定的先验知识,训练样本的选择主观性强对结果的影响比较大;Zhang(2013)提出结合NDVI和NTL夜间灯光数据构建调整型夜间灯光指数VANUI用以提取城镇信息,指数构建通常并非以城镇结构作为依据,而是通过统计规律及常识进行构建,主观性强,适用范围有限;阈值法(Henderson et al.2003;Imhoff et al.1997;Liu et al. 2012;Sutton 2003)是应用最广泛的一种方法,但是最优阈值的选择一直是很难客观解决的问题。

发明内容

本发明的目的是解决目前传统城乡分类遗传算法主观性强,适用范围窄,计算速度慢,精度低的技术问题。

为实现以上发明目的,本发明提供一种融合多源数据的遗传分类算法,包括如下步骤:

(1)编码

将遥感影像与种群基因相关联,将夜间灯光数据像元值转化为基因值;

(2)种群初始化

根据种群大小、变异概率、交叉概率、最大遗传代数产生随机种群,种群中的每个个体由一个基因序列表示;

(3)构建适应度函数

适应度函数的构建分为以下四步:

a.初始分割

设个体的基因值对应的灯光亮度值为Chi,以Chi对VIIRS DNB进行初始分割,得到初始城乡分布;

b.掩膜

应用上一步得到的初始分割结果对VIIRS DNB、NDVI以及NDBI数据进行掩膜,可以得到城市覆盖类型和非城市覆盖类型下的VIIRS DNB、NDVI及NDBI影像;

c.计算类间方差和类内方差

根据掩膜结果,将VIIRS DNB、NDVI以及NDBI数据分别划分为初始城区范围和初始乡村范围;以n0和n1分别表示城市部分和乡村部分的像元数,城市部分像元定义为C0,乡村部分像元定义为C1:

C0={u1,u2,…,un0};

C1={n1,n2,…,nn1};

城市部分的像元亮度均值为μ0,乡村部分的像元亮度均值为μ1:

C0和C1的方差为:

C0和C1占整幅影像的比例为:

类间方差σb2和类内方差σin2分别定义为:

d.计算适应度函数

以类间方差与类内方差的商构建影像分割函数f:

通过分别计算VIIRS DNB、NDVI和NDBI的分割函数fVIIRS、fNDVI和fNDBI来构建适应度函数,可得基因型Chi对应的适应度函数为:

fitness(Chi)=2×fVIIRS+fNDVI+fNDBI

(4)进行遗传过程

通过选择过程、交叉过程和变异过程进行遗传进化,产生末代种群;

(5)结束遗传过程

当适应度函数值在遗传过程中连续五代没有发生改变时,或者,当遗传代数达到步骤(2)中设置的最大遗传代数时,结束遗传过程。

进一步地,步骤(1)中,依据夜间灯光数据的实际值域区间确定基因编码长度为12bit。

进一步地,步骤(4)中,所述选择过程选用轮转赌盘法进行选择。

与现有技术相比,本发明的有益效果是:

本算法以城市群为研究对象,通过结合三种遥感数据:VIIRS DNB、NDVI 和NDBI,重新构建遗传算法的适应度函数,通过改进的遗传算法计算出最优阈值,能客观、快速、准确的获得城乡分类结果。

附图说明

图1是本发明的流程图;

图2是本发明以珠江三角洲为例的算法结果展示图;

图3是本发明计算结果的精度定性评价图;

具体实施方式

下面结合附图和具体实施例对本发明作进一步说明。

本算法采用了以下研究数据:

1、夜间灯光数据

The Visible-Infrared Imager-Radiometer Suite(VIIRS)是新一代的辐射计,VIIRS Day/Night Band(DNB)数据相比于前一代夜间灯光数据DMSP/OLS 有着明显的进步,主要总结为以下三个方面:空间分辨率从1km提高至500m;星上定标使数据质量更高;16bit的数据量所包含的信息要远远多于DMSP的DN 值范围(0-63),能够大大缓解夜间灯光数据城市区域灯光饱和的问题。

2、MODIS数据

自2000年起,MODIS数据称为全球尺度研究应用最广泛的数据,应用500m MODIS 8-day surface reflectance product(MOD09A1)计算得到Normalized Difference Vegetation Index(NDVI),Normalized Difference Build-up Index(NDBI)以及Modified Normalized Difference water Index(MNDWI)。应用MNDWI数据做水体掩膜,可以将水体的影响剔除;归一化植被指数NDVI用于表征植被覆盖;归一化建筑指数NDBI用于表征建筑用地的土地覆盖类型。

本发明提出基于Genetic Algorithm(GA)遗传算法的分类方法用于自动产生最优阈值以快速、准确地提取城乡信息,如技术流程图,本算法主要分为以下四步:

1、编码

在遗传算法中,编码的过程就是将研究对象与遗传学中基因相关联,所以确定编码规则,是遗传算法应用于实际问题的第一步。将遥感影像与种群基因相关联的方法就是将像元值转化为基因值,本项目依据夜间灯光数据的实际值域区间确定基因编码长度为12bit。

2、种群初始化

确定种群编码规则后,根据种群大小、变异概率、交叉概率、最大遗传代数产生随机种群,本项目中种群中的每个个体由一个基因序列表示,基因的遗传变异会影响个体的表现型。

3、适应性函数构建

“优胜劣汰,适者生存”,适应度函数反映了个体的生存能力,遗传算法的最优解,也是遗传算法中最重要的一部分。本项目适应度函数的构建分为四步:

初始分割

个体的基因值对应的灯光亮度值为Chi,以Chi对VIIRS DNB进行初始分割,得到初始城乡分布。

掩膜

应用上一步得到的初始分割结果对VIIRS DNB,NDVI以及NDBI数据进行掩膜,可以得到城市覆盖类型和非城市覆盖类型下的DNB,NDVI及NDBI影像。

计算类间方差和类内方差

根据掩膜结果,将VIIRS DNB,NDVI以及NDBI数据分别划分为初始城区范围和初始乡村范围。n0和n1分别是城市部分和乡村部分的像元数,城市部分定义为C0,乡村部分定义为C1:

C0={u1,u2,…,un0}

C1={n1,n2,…,nn1}

城市部分的像元亮度均值为μ0,乡村部分的均值为μ1:

C0和C1的方差为:

C0和C1占整幅影像的比例为:

类间方差σb2,类内方差σin2分别定义为:

计算适应度函数

已知当图像分类结果类间方差最大类内方差最小,表明影像的分类结果较好,因此以类间方差与类内方差的商构建影像分割函数f:

分别计算VIIRS DNB,NDVI以及NDBI的分割函数,构建适应度函数,计算可得基因型Chi对应的适应度函数值:

fitness(Chi)=2×fVIIRS+fNDVI+fNDBI

遗传过程

遗传算法通过遗传过程进行“优胜劣汰”的选择,遗传过程中的变异与交叉使得该算法能够避免陷于局部最优,从而得到全局最优解。选择过程,本项目选用轮转赌盘法进行选择,适应度函数值高的种群个体更容易被选中,从而进行遗传进化;交叉过程,通过自然选择的个体,以一定的交叉概率进行基因间互换,是遗传变异的一种形式;变异过程,通过个体基因点位的变化,产生新的个体,从而使种群样本更加丰富。

判断遗传过程是否结束

改进的遗传算法是一个循环过程,如果该过程中出现以下两种情况中的任一种,则判断该过程结束:当适应度函数值在遗传过程中连续五代没有发生改变时,说明算法已经搜索到全局最优值,则遗传过程结束;当遗传代数达到在种群初始化中设置的最大遗传代数时,算法结束。

通过构建适用于城乡分类的遗传算法适应度函数以及融合多源数据:VIIRS DNB,NDVI和NDBI可对城市群进行城乡时空信息的提取。如图2所示,以珠江三角洲为例,展示算法的分类结果。图2.(a)(b)(c)分别为珠江三角洲的VIIRS DNB,NDVI和NDBI影像,可以看出明显的城乡区别:城市像元值在VIIS DNB和 NDBI影像上高而在NDVI影像上低;相反的,农村像元值在在VIIS DNB和NDBI 影像上低而在NDVI影像上高。图2.(d)中本算法的分类结果与三种数据分别展示的城乡分异有相似的空间分布,为了进一步对本算法的计算结果进行评价,着重算法精度评价:

以30米的Landsat8OLI影像的土地利用分类结果作为验证数据,对本项目改进的遗传算法城乡分割结果进行精度评价。本项目中,将城市群作为整体进行研究,但是城市群范围较大,需要多景Landsat影像进行拼接,很难收集到时相相近且受云雾影像小的多幅验证影像。所以精度评价时,将选取城市群中的典型的城市进行评价,即以城市群为研究对象进行遗传算法分割,再从整个城市群的分割结果中裁剪出典型城市对其进行精度评价。

选取珠江三角洲城市群的典型城市广州市对改进的遗传算法进行精度评价,本次精度评价分为定性评价和定量评价两部分。如图3所示,3.(a)是Landsat 8OLI的分类结果,通过将遗传算法的分类结果与其进行对比可以发现,应用本文中改进的遗传算法提取的城市区域(3.(c)),与代表真实地表覆盖的Landsat 影像分类结果在空间分布上具有较好的一致性;3.(b)是Landsat影像的假彩色显示,对比假彩色影像可以很明显看出本文遗传算法提取的城镇空间信息与实际情况相符。综上,从定性的角度评价遗传算法提取城乡信息具有较高的精度。

表1定量精度评价

从定量的角度对本文提出的算法进精度评价,如表1,可以看出遗传算法的分类结果与Landsat 8OLI影像的分类结果相比,差异并不明显,总体精度达到0.91,Kappa系数达到0.71。综上,从定性和定量两个角度对本文提出的结合VIIRS DNB,NDVI和NDBI数据基于遗传算法的城乡分割算法具有较高的精度,能够满足快速、准确、高效的提取城镇信息的要求。

除上述实施方式外,本发明还可以有其他实施方式,凡采用等同替换或等效变换形成的技术方案,均落在本发明的保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号