首页> 中国专利> 面对多尺度分割的产草量估算方法、装置及存储介质

面对多尺度分割的产草量估算方法、装置及存储介质

摘要

本发明公开了一种面对多尺度分割遥感数据和随机森林算法的产草量估算方法,包括以下步骤:获取遥感数据并进行预处理;对预处理后的数据进行多尺度分割获得分割结果;获取产草区样本点实测数据并根据实测数据分别创建草地类别分类样本和产草量估算样本;根据分割结果和草地类别分类样本构建随机森林分类器并获得草地类型分类结果;根据草地类型分类结果、分割结果和产草量估算样本建立随机森林估算模型;使用分割结果作为随机森林估算模型的输入向量预测产草量;还公开了一种面对多尺度分割遥感数据和随机森林算法的产草量估算装置及可读存储介质。运算高效、结果准确。

著录项

  • 公开/公告号CN112446522A

    专利类型发明专利

  • 公开/公告日2021-03-05

    原文格式PDF

  • 申请/专利号CN201910822474.7

  • 申请日2019-09-02

  • 分类号G06Q10/04(20120101);G06K9/62(20060101);G06N3/00(20060101);

  • 代理机构31306 上海愉腾专利代理事务所(普通合伙);

  • 代理人谢小军

  • 地址 100091 北京市海淀区东小府2号

  • 入库时间 2023-06-19 10:06:57

说明书

技术领域

本发明涉及卫星测算技术领域,尤其涉及一种面对多尺度分割遥感数据和随机森林的产草量估算方法、装置及存储介质。

背景技术

草地资源是全球陆地生态系统的重要组成部分,在生态环境中起着举足轻重的作用。对草地资源监测有助于了解掌握草地实际情况,合理开发利用草地资源,达到维护草原生态系统平衡的目的。草地遥感估产是通过卫星传感器或地面光谱仪获取地球表面信息,在地物光谱理论指导下,将获取的地球表面信息经过复杂的综合处理,以识别草地及其长势,实现草地面积和长势监测及单产和总产的预报。使用遥感技术进行草地估产最早起源于国外,国内的研究起步较晚,但是发展很快。经研究,最初人们基于AVHRR-NDVI数据进行草原遥感估产,并且通过建立回归模型探究植被指数NDVI和产草量之间的关系。随着技术的发展,利用地面光谱实验数据或高光谱数据、地面监测样本数据结合Landsat、MODIS等数据产品,通过建立不同的反演模型估测草地产草量、探究草地生长状况。

哨兵2号(Sentinel-2)是欧洲太空局于2015年6月发射的多光谱成像卫星,携带一枚多光谱成像仪(MSI),具有最高可达10m分辨率、可覆盖13个光谱波段的遥感数据,用于陆地监测,可提供植被、土壤和水覆盖、内陆水路及海岸区域等图像,还可用于紧急救援服务。目前已发送Sentinel-2A和Sentinel-2B两颗卫星,一颗卫星的重访周期为10天,两颗互补,重访周期为5天。但是由于Sentinel-2是新发射的卫星,目前将Sentinel-2数据用于草原地区遥感估产的研究较少。

高分一号(GF-1)卫星是中国高分辨率对地观测卫星系统重大专项的第1颗卫星,于2013-04-26由长征二号丁运载火箭在酒泉卫星发射基地成功发射入轨,搭载了4台空间分辨率为16m的宽视场(Wide Field View,WFV)传感器,2台全色和多光谱传感器(Pan andMultispectral Sensor,PMS),其中全色影像的空间分辨率为2m,多光谱影像的空间分辨率为8m。GF-1号卫星为草原资源监测提供了新的数据源。

合成孔径雷达(synthetic aperture radar,SAR)对地表覆盖区具有一定的穿透性,具有全天时全天候工作的能力,能穿透地表浅覆盖层,对覆盖层以下的地质特征进行有效探测,穿透深度与波长、地表介电常数、地表粗糙度有关。高分三号(GF-3)卫星是我国首颗C波段全极化合成孔径雷达成像卫星,于2016年8月10日在太原卫星发射中心成功发射升空,可以全天时全天候实现海洋和陆地信息的监测。

高分六号(GF-6)是我国2018年6月2日发射的一颗低轨光学遥感卫星,具有高分辨率、宽覆盖、高质量和高效成像等特点,能有力支撑农业资源监测、林业资源调查、防灾减灾救灾等工作。GF-6可以与GF-1组网运行,将使遥感数据获取的时间分辨率从4天缩短到2天。

发明内容

鉴于目前存在的上述不足,本发明提供一种面对多尺度分割遥感数据和随机森林算法的产草量估算方法,能够估算获得结果较准确的产草量。

为达到上述目的,本发明的实施例采用如下技术方案:

一种面对多尺度分割遥感数据和随机森林算法的产草量估算方法,所述产草量估算方法包括以下步骤:

获取遥感数据并进行预处理;

对预处理后的数据进行多尺度分割获得分割结果;

获取产草区样本点实测数据并根据实测数据分别创建草地类别分类样本和产草量估算样本;

根据分割结果和草地类别分类样本构建随机森林分类器并获得草地类型分类结果;

根据草地类型分类结果、分割结果和产草量估算样本建立随机森林估算模型;

使用分割结果作为随机森林估算模型的输入向量预测产草量。

依照本发明的一个方面,所述获取遥感数据并进行预处理包括:

Sentinel数据获取及预处理;

GF数据获取及预处理。

依照本发明的一个方面,所述Sentinel数据获取及预处理包括:对Sentinel原始数据进行辐射定标以及大气校正;采用双三次卷积的方式将影像波段重采样至质量最好的10m分辨率。

依照本发明的一个方面,所述GF数据获取及预处理包括:GF-1数据、GF-3数据和GF-6数据的获取及预处理,其中:

GF-1数据获取及预处理包括:对于GF1-1 PMS影像数据,需要进行多光谱影像辐射定标、大气校正和正射校正,再对全色影像进行辐射定标与正射校正,之后将校正后的多光谱影像与全色影像融合,得到具有多光谱信息和高空间分辨率的遥感融合影像;

GF-3数据获取及预处理包括:对GF-3影像进行辐射定标、复数据转换、多视处理、滤波以及转DB影像的预处理操作;

GF-6数据获取及预处理包括:对GF-6号数据进行辐射定标、大气校正和几何校正。

依照本发明的一个方面,在对预处理后的数据进行多尺度分割获得分割结果之前,需对预处理后的数据进行影像镶嵌和影像裁剪步骤。

依照本发明的一个方面,包括以下步骤:

将需要计算的实测点总产草量鲜重/可食产草量鲜重作为Y值存入样本之中,将从分割结果提取出的波段值以及EVI、NDVI值作为X值;

使用机器学习库进行随机森林回归模型建模,构建的随机森林回归模型用{h(X,Θk),k=1,…}表示,其中X为输入向量,{Θk}为独立同分布随机向量。

依照本发明的一个方面,所述随机森林分类器和随机森林估算模型均需要进行随机森林回归模型建模,具体包括以下步骤:

对输入样本数据集做归一化处理;

将样本数据集划分为训练集和测试集;

对于训练集D={(x

对每个训练集生成对应的决策树C

将生成的多棵决策树构成随机森林,对于测试集样本X,利用每棵决策树进行测试,得到预测结果C

作为随机森林估算模型时,测试集样本X的预测值是这些树的结果的平均值;

作为随机森林分类器时,预测的最终类别为该样本点所到叶节点中投票数最多的类别。

依照本发明的一个方面,所述作为随机森林估算模型时,测试集样本X的预测值是这些树的结果的平均值包括:

对任意划分特征A,对应的任意划分点S两边划分成的数据集D

其中,c

依照本发明的一个方面,作为随机森林分类器时,预测的最终类别为该样本点所到叶节点中投票数最多的类别包括:

RF中的每一棵分类树都为二叉树,其生成遵循自顶向下的递归分裂原则,即从根节点开始依次对训练集进行划分;在二叉树中,根节点包含全部训练数据,按照节点不纯度最小原则分裂为左右节点,它们分别包含训练数据的一个子集,按照同样的规则节点继续分裂,直到满足分支停止规则而停止生长;若节点n上的分类数据全部来自于同一类别,则此节点的不纯度为0,不纯度度量方法是Gini准则:

对于一个给定的训练集D,假设训练集中由K类,C

如果训练样本被特征A的是否取某一个值a而被分成D1和D2两部分,那么在特征A的条件下的基尼指数为:

相当于对根据特征A划分的两个小集合分别求基尼指数然后根据经验概率取期望得到特征A下的D的基尼指数。

依照本发明的一个方面,所述进行随机森林回归模型建模包括判定变量重要性,具体包括:

在每一棵决策树的变量中加入随机噪声,然后检验袋外误差的增减,如果误差增加,则改变量比较重要,反之则不重要;

计算方法为:

其中,

依照本发明的一个方面,包括进行模型评价,所述模型评价选择选择决定系数(R

其中,y

依照本发明的一个方面,所述对预处理后的数据进行多尺度分割获得分割结果包括:

将遥感图像分割成若干个互不重叠同时没有孔洞的子集区域,每个区域内部具有相同或相似的特征,表征了一种地物;选择同质异质法使对象类同质性尽量大,对象间同质性尽量小;同质性由影像对像内部的面积和标准差来表示,具体公式为:

其中,a

异质性通过影像对象间的空间相关性指标Moran’sI(MI)表示,具体公式为:

其中,n为该尺度下分割区域的个数,w

一种面对多尺度分割遥感数据和随机森林算法的产草量估算装置,所述产草量估算装置包括:

存储器,用于存储计算机程序;

处理器,用于执行所述计算机程序时实现如上所述的任一面对多尺度分割遥感数据和随机森林算法的产草量估算方法的步骤。

一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被执行时实现如上所述的任一面对多尺度分割遥感数据和随机森林算法的产草量估算方法的步骤。

本发明实施的优点:本发明所述的面对多尺度分割遥感数据和随机森林算法的产草量估算方法,包括以下步骤:获取遥感数据并进行预处理;对预处理后的数据进行多尺度分割获得分割结果;获取产草区样本点实测数据并根据实测数据分别创建草地类别分类样本和产草量估算样本;根据分割结果和草地类别分类样本构建随机森林分类器并获得草地类型分类结果;根据草地类型分类结果、分割结果和产草量估算样本建立随机森林估算模型;使用分割结果作为随机森林估算模型的输入向量预测产草量;无需对变量的正态性和独立性等假设条件进行检验,同时也不需要考虑多变量的共线问题,且运算高效、结果准确。有较高的准确率,对异常值和噪声具有较好的容忍度,对高光谱遥感等高维度数据训练和学习效果较佳。同时,机器学习中的一个重大问题是过拟合,对于随机森林而言,只要森林中有足够多的树,分类器就不会过度拟合模型,泛化能力强。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明所述的一种面对多尺度分割遥感数据和随机森林算法的产草量估算方法流程示意图;

图2为本发明所述的海晏研究区总产草量分布图;

图3为本发明所述的海晏研究区可食产草量分布图;

图4为本发明所述的祁连研究区总产草量分布图;

图5为本发明所述的祁连研究区可食产草量分布图;

图6为本发明所述的产草量估算装置示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例一

如图1、图2、图3、图4和图5所示,一种面对多尺度分割遥感数据和随机森林算法的产草量估算方法,所述产草量估算方法包括以下步骤:

步骤S1:获取遥感数据并进行预处理;

所述获取遥感数据并进行预处理包括:

1)Sentinel数据获取及预处理;

2)GF数据获取及预处理;

其中,Sentinel数据获取及预处理包括以下具体实施:

根据实际项目需要,以及实地采样区与采样时间,选择所需Sentinel-2A或Sentinel-2B数据,数据要求基本无云,影像质量高。通过欧洲太空局(ESA)的数据共享网站(https://scihub.copernicus.eu/dhus/)直接获取的Sentinel-2数据是Level-1C级多光谱数据,是经过几何精校正的正射影像,投影坐标系为UTM/WGS-84。ESA还对Sentinel-2L2A级数据进行了定义,L2A级数据主要包含经过辐射定标和大气校正的大气底层反射率数据,这个L2A级数据需要用户自行处理。Sentinel-2数据波段参考如下:

表1 Sentinel-2卫星数据部分参数信息

在实际应用中,需要对Sentinel原始数据进行辐射定标以及大气校正。从表1可以看出,Sentinel-2波段的空间分辨率并不统一,在这里使用双三次卷积的方式将影像波段重采样至质量最好的10m分辨率,并且根据研究区域需要,对数据进行波段组合、影像拼接和裁剪。

在实际应用中,地物辐射定标原理如下:

L=gain×DN+bias

其中,L是地物在大气顶部的辐射亮度,DN是象元值,gain是定标增益,gain和bias可从头文件中得到,ρ是地物反射率,d

Flaash大气校正原理如下:

其中,等式右边前2项分别为辐射亮度的直射、散射分量,是太阳辐射传输中地表与大气共同作用的结果;L

GF数据获取及预处理具体可包括如下实施:

GF-1、GF-3和GF-6数据均都由中国资源卫星应用中心提供。

GF-1数据将高空间分辨率、高时间分辨率等优势集合于一体,在这里选择GF-1PMS数据作为数据源,其参数设置如表2所示。两台PMS相机组合使传感器在空间分辨率高的同时具备较大的幅宽,另外传感器具有良好的侧摆成像能力,可以在应急状态下对特定的区域进行高时间频次观测。对于GF1-1 PMS影像数据,需要进行多光谱影像辐射定标、大气校正、正射校正,再对全色影像进行辐射定标与正射校正,之后将校正后的多光谱影像与全色影像融合,得到具有多光谱信息和高空间分辨率的遥感融合影像。根据具体需求,对影像进行镶嵌拼接。

表2 GF-1PMS参数设置

在这里使用超分辨率贝叶斯算法(Pansharp)对GF-1数据进行融合。该算法基于最小二乘法对参与融合的原始多光谱影像、全色影像与融合后的多光谱影像、全色影像之间的灰度值关系进行最佳匹配,并采用统计的方法来解决融合过程标准化和自动化的问题,使得融合影像在获得高空间分辨率的同时,还具备良好的光谱保真度。该算法因不受波段数限制,光谱和细节特征保真度高,是目前高分辨率遥感影像融合中公认比较好的算法之一。

GF-3号卫星聚束、条带、扫描、全极化、波成像、全球观测、高低入射角12种成像模式,最高分辨率可达1m。这里选择成像方式如表3所示,并对GF-3影像进行了辐射定标、复数据转换、多视处理、滤波以及转DB影像(输出TIFF)等一系列预处理操作。

表3 可用于产草量估算的GF-3号卫星成像模式

对GF-3数据辐射定标一般是把后向散射能量强度转换为后向散射系数,定标公式为:

其中,σ

SAR影像最主要的特征之一是强度或者幅度,利用强度/幅度特征,可以提取地物目标信息,因此需要将SAR复数数据转换为SAR强度/幅度数据。SAR数据是由实部和虚部构成的复数据,也称为同相(In-phase)和正交通道(Quadrature channels)。强度公式为:

其中:A=Amplitude,I=In-phase,Q=Quadrature channels。强度和幅度之间的转换公式为:Intensity=Amplitude

多视处理,可以提高图像的可视效果,并优化每个像元后向散射的估计精度,具体是对邻域像素相干和的平均,公式如下:

使用Non-Local Means滤波对GF-3进行滤波处理,Non-Local Means滤波是一种极化SAR影像滤波方法,对斑点噪声有高抑制性和细节信息有高保真性。其原理是通过寻找整幅图像中与待恢复区域相似得块,再将找出得所有相似块通过某种相似性准则(如K均值聚类)进行聚类后联合滤波,从而减少图像噪声。而对于图像相似性的计算,可以通过比较一个窗口内的各个像素值来得到。Non-local Means算法公式为:

其中,

其中:

Z(x)表示归一化系数,h为平滑参数h为平滑参数。图像块之间的相似性由欧氏距离决定,从w(x,y)计算式可以看出,欧氏距离越大,该算法去噪能力对平滑参数的选择依赖性越高。

GF-6配置2米全色/8米多光谱高分辨率相机、16米多光谱中分辨率宽幅相机,2米全色/8米多光谱相机观测幅宽90公里,16米多光谱相机观测幅宽800公里。GF-6还实现了8谱段CMOS探测器的国产化研制,国内首次增加了能够有效反映作物特有光谱特性的“红边”波段。对GF-6号数据同样进行辐射定标、大气校正和几何校正。

步骤S2:对预处理后的数据进行多尺度分割获得分割结果;

所述对预处理后的数据进行多尺度分割获得分割结果包括:

遥感影像的分割是将其分割成若干个互不重叠同时没有孔洞的子集区域,每个区域内部具有相同或相似的特征,表征了一种地物。在这里选择同质异质法使对象类同质性尽量大,对象间同质性尽量小。同质性由影像对像内部的面积和标准差来表示,具体公式为:

其中,a

异质性通过影像对象间的空间相关性指标Moran’sI(MI)表示,具体公式为:

其中,n为该尺度下分割区域的个数,w

所述分割结果包括:Sentinel-2特征波段,GF-1PMS特征波段,GF-3特征波段,GF-6特征波段。

步骤S3:获取产草区样本点实测数据并根据实测数据分别创建草地类别分类样本和产草量估算样本;

采用的实测数据主要包括草本样方编号、经纬度、植被盖度、主要植物种类、总产草量鲜重及风干重、可食产草量鲜重及风干重、调查时间等信息。根据牧草生长规律,调查时间选择集中在7-8月为佳,这是牧草生长最旺盛的时期。并且考虑产草量估算精度,实测数据分布应尽可能均匀,并且为研究区内的草地类型选择数量足够的样方进行实测。

根据实测数据分别创建草地类别分类样本和产草量估算样本。具体包括:

植被指数是将遥感影像上不同波段的光谱反射率通过线性或非线性方式组合,得到反应地表植被状况的度量。根据过往研究,选择NDVI、EVI两种能较好的反映地表植被覆盖情况的植被指数作为特征值。根据样本点坐标,提取样本点对应波段值以及增强植被指数EVI、归一化植被指数NDVI作为样本数据,存储格式为.csv。

其中,ρ

在本实施例中,需要对植被指数NDVI进行判断,判断NDVI是否>0.15,若大于0.15则说明有植被,该数据可参与后续步骤;若小于0.15则说明无植被,数据不采用。

步骤S4:根据分割结果和草地类别分类样本构建随机森林分类器并获得草地类型分类结果;

根据草地类别分类样本,结合预处理并多尺度分割后的遥感数据,通过建立随机森林模型进行草地类型分类。在这里使用python的机器学习库scikit-learn(sklearn)进行随机森林模型建模,sklearn支持包括分类、回归、降维和聚类四大机器学习算法,还包含了特征提取、数据处理和模型评估三大模块。所述随机森林模型的建立包括以下步骤:

数据归一化

由于选取的评价值之间有不同得量纲和量纲单位,这种情况会影响最终结果,为了消除这种影响,需要对输入样本数据集做归一化处理,使样本特征分布接近标准正态分布,以达到更好得效果。在这里使用MinMacScaler将特征缩放到给定得最小值和最大值之间,通常取值(0,1)。

其中,x

样本训练集与测试集选取

在进行建模之前,需要将样本数据集划分为训练集和测试集,在划分训练集和测试集时,需要进行权衡,如果测试集数据越小,对模型得泛化误差得估计越不准确。一般在实际应用中,基于整个数据集的大小考虑,训练集数据和测试集数据的划分比例是6:4、7:3或8:2。对于庞大的数据可以使用9:1,甚至是99:1。

RF模型建立

RF是在Bagging基础上做了修改演化而来的。Bagging算法是在原始的数据集上采用有放回的随机取样的方式来抽取m个子样本,从而利用这m个子样本训练m个学习器,降低了模型的方差,然后将数据放在这m个分类器上,最后根据这个m个分类器的投票结果,决定数据属于哪一类。RF在此基础上改动了两处:一是在训练每个学习器时,不是从所有特征中选择最优特征来进行节点切分,而是随机的选取k个特征,从这k个特征中选择最优特征来切分节点;二是使用CART决策树。

RF回归模型用{h(X,Θk),k=1,…}表示,其中X为输入向量,{Θk}为独立同分布随机向量。

具体算法步骤如下:

对于训练数据集D={(x

(1)利用Bootstrap方法重采样,随机产生T个训练集S

(2)对每个训练集生成对应的决策树C

(3)将生成的多棵决策树构成随机森林,对于测试集样本X,利用每棵决策树进行测试,得到预测结果C

(4)预测的最终类别为该样本点所到叶节点中投票数最多的类别。

CART分类树创建

RF中的每一棵分类树都为二叉树,其生成遵循自顶向下的递归分裂原则,即从根节点开始依次对训练集进行划分;在二叉树中,根节点包含全部训练数据,按照节点不纯度最小原则分裂为左右节点,它们分别包含训练数据的一个子集,按照同样的规则节点继续分裂,直到满足分支停止规则而停止生长;若节点n上的分类数据全部来自于同一类别,则此节点的不纯度为0,不纯度度量方法是Gini准则:

对于一个给定的训练集D,假设训练集中由K类,C

如果训练样本被特征A的是否取某一个值a而被分成D1和D2两部分,那么在特征A的条件下的基尼指数为:

相当于对根据特征A划分的两个小集合分别求基尼指数然后根据经验概率取期望得到特征A下的D的基尼指数。

RF模型判定变量重要性的方法使在每一棵决策树的变量中加入随机噪声,然后检验袋外误差的增减,如果误差增加,则改变量比较重要,反之则不重要。计算方法为:

其中,

模型评价

模型评价选择决定系数(R

其中,y

步骤S5:根据草地类型分类结果、分割结果和产草量估算样本建立随机森林估算模型;

所述步骤S5的具体实现过程可如下:

根据产草量估算样本。将需要计算的实测点总产草量鲜重/可食产草量鲜重作为Y值存入样本之中,将提取出的波段值以及EVI、NDVI值作为X值,在这里使用python的机器学习库scikit-learn(sklearn)进行随机森林回归模型建模,sklearn支持包括分类、回归、降维和聚类四大机器学习算法,还包含了特征提取、数据处理和模型评估三大模块。

所述随机森林模型的构建如下:

数据归一化

由于选取的评价值之间有不同得量纲和量纲单位,这种情况会影响最终结果,为了消除这种影响,需要对输入样本数据集做归一化处理,使样本特征分布接近标准正态分布,以达到更好得效果。在这里使用MinMacScaler将特征缩放到给定得最小值和最大值之间,通常取值(0,1)。

其中,x

样本训练集与测试集选取

在进行建模之前,需要将样本数据集划分为训练集和测试集,在划分训练集和测试集时,需要进行权衡,如果测试集数据越小,对模型得泛化误差得估计越不准确。一般在实际应用中,基于整个数据集的大小考虑,训练集数据和测试集数据的划分比例是6:4、7:3或8:2。对于庞大的数据可以使用9:1,甚至是99:1。

RF模型建立

RF是在Bagging基础上做了修改演化而来的。Bagging算法是在原始的数据集上采用有放回的随机取样的方式来抽取m个子样本,从而利用这m个子样本训练m个学习器,降低了模型的方差,然后将数据放在这m个分类器上,最后根据这个m个分类器的投票结果,决定数据属于哪一类。RF在此基础上改动了两处:一是在训练每个学习器时,不是从所有特征中选择最优特征来进行节点切分,而是随机的选取k个特征,从这k个特征中选择最优特征来切分节点;二是使用CART决策树。

RF回归模型用{h(X,Θk),k=1,…}表示,其中X为输入向量,{Θk}为独立同分布随机向量。

具体算法步骤如下:

对于训练数据集D={(x

(1)利用Bootstrap方法重采样,随机产生T个训练集S

(2)对每个训练集生成对应的决策树C

(3)将生成的多棵决策树构成随机森林,对于测试集样本X,利用每棵决策树进行测试,得到预测结果C

(4)对于回归问题,测试集样本X的预测值是这些树的结果的平均值。

CART回归树创建

使用CART构建回归树时,采用的原则是最小方差。即对任意划分特征A,对应的任意划分点S两边划分成的数据集D

其中,c

模型评价

模型评价选择决定系数(R

其中,y

步骤S6:使用分割结果作为随机森林估算模型的输入向量预测产草量。

所述步骤S6使用分割结果作为随机森林估算模型的输入向量预测产草量的具体实施步骤如下:

采用的遥感数据为进行了包含分割的预处理后的遥感数据,使用gdal类库读取预处理之后的遥感数据,将影像波段值按样本的格式存入数组作为输入向量。进行影像多尺度分割、植被覆盖判断、草地类型分类、分类别草地产草量估算,并将预测出的总产草量结果输出为TIFF影像。

实施例二

如图6所示,一种面对多尺度分割遥感数据和随机森林算法的产草量估算装置,所述产草量估算装置包括:

存储器100,用于存储计算机程序;

处理器200,用于执行所述计算机程序时实现如上实施例所述的面对多尺度分割遥感数据和随机森林算法的产草量估算方法的步骤。

实施例三

一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被执行时实现如上实施例所述的面对多尺度分割遥感数据和随机森林算法的产草量估算方法的步骤。

在实际应用中,包括以下实施数据:

设定有两个研究区,分别为海晏研究区和祁连研究区;

其中,海晏研究区地处100.708769~101.136171°E,36.897002~37.188647°N,主要分布草地类型是高寒草甸和温性草原;祁连研究区地处100.495069~100.860690°E,37.588238~37.801124°N,主要分布草地类型是高寒草甸和温性草原。

进行RF模型建立,并且对总产草量和可食产草量分别建模,按照实施例一和实施例二的步骤及流程图方法估算出产草量,并将结果保存为TIFF影像。如图2所示,为海晏研究区的总产草量专题图集;如图3所示,为海晏研究区的可食产草量专题图集。如图4所示,为祁连研究区的总产草量专题图集;如图5所示,为祁连研究区的可食产草量专题图集。

无需对变量的正态性和独立性等假设条件进行检验,同时也不需要考虑多变量的共线问题,且运算高效、结果准确。有较高的准确率,对异常值和噪声具有较好的容忍度,对高光谱遥感等高维度数据训练和学习效果较佳。同时,机器学习中的一个重大问题是过拟合,对于随机森林而言,只要森林中有足够多的树,分类器就不会过度拟合模型,泛化能力强。

本发明实施的优点:本发明所述的面对多尺度分割遥感数据和随机森林算法的产草量估算方法,包括以下步骤:获取遥感数据并进行预处理;对预处理后的数据进行多尺度分割获得分割结果;获取产草区样本点实测数据并根据实测数据分别创建草地类别分类样本和产草量估算样本;根据分割结果和草地类别分类样本构建随机森林分类器并获得草地类型分类结果;根据草地类型分类结果、分割结果和产草量估算样本建立随机森林估算模型;使用分割结果作为随机森林估算模型的输入向量预测产草量;无需对变量的正态性和独立性等假设条件进行检验,同时也不需要考虑多变量的共线问题,且运算高效、结果准确。有较高的准确率,对异常值和噪声具有较好的容忍度,对高光谱遥感等高维度数据训练和学习效果较佳。同时,机器学习中的一个重大问题是过拟合,对于随机森林而言,只要森林中有足够多的树,分类器就不会过度拟合模型,泛化能力强。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本领域技术的技术人员在本发明公开的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号