首页> 中国专利> 一种基于云计算平台和随机森林算法的火烧迹地提取方法

一种基于云计算平台和随机森林算法的火烧迹地提取方法

摘要

本发明涉及火烧迹地提取方法技术领域,具体涉及一种基于云计算平台和随机森林算法的火烧迹地提取方法,包括如下步骤:步骤1)遥感数据获取、预处理及构建时间序列影像数据集;步骤2)构建火烧迹地样本库;步骤3)划分样点数据;步骤4)特征向量提取及建立时间序列特征向量影像集;步骤5)构建随机森林模型并优化模型;步骤6)火烧迹地提取结果精度评价;步骤7)火烧迹地制图;本发明将随机森林算法应用到火烧迹地提取方法中,实现了逐年、高精度、大尺度上的火烧迹地提取,在时间尺度上对火烧迹地进行动态监测,可以快速获取影像质量高的合成遥感数据,显著提高用户的研究和工作效率,最终实现大尺度、长时序火烧迹地快速、自动的提取。

著录项

  • 公开/公告号CN116385864A

    专利类型发明专利

  • 公开/公告日2023-07-04

    原文格式PDF

  • 申请/专利号CN202211722205.1

  • 发明设计人 任春颖;任慧鑫;王宗明;贾明明;

    申请日2022-12-30

  • 分类号G06V20/10(2022.01);G06V20/52(2022.01);G06V10/62(2022.01);G06V10/764(2022.01);G06V10/774(2022.01);

  • 代理机构北京和鼎泰知识产权代理有限公司 11695;

  • 代理人李涵

  • 地址 130000 吉林省长春市高新技术产业开发区长东北核心区盛北大街4888号

  • 入库时间 2024-01-17 01:14:25

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-07-21

    实质审查的生效 IPC(主分类):G06V20/10 专利申请号:2022117222051 申请日:20221230

    实质审查的生效

  • 2023-07-04

    公开

    发明专利申请公布

说明书

技术领域

本发明涉及火烧迹地提取方法技术领域,具体涉及一种基于云计算平台和随机森林算法的火烧迹地提取方法。

背景技术

森林火灾是森林扰动的主要类型之一,能够直接改变森林生态系统的群落组成、年龄结构、生态系统的能流和养分循环等,进而对区域碳循环、生物多样性、全球气候变化等产生重要影响。因此,准确快速地识别火灾发生范围并提取火烧迹地,可为森林生态系统火后恢复策略的制定、森林质量提升与可持续发展等提供重要的决策依据。传统的野外调查方法受天气、地形等环境条件影响大,且耗费研究人员大量的时间和精力,随着遥感技术的高速发展和可用数据源的不断增加,火干扰信息提取从传统的单时相到多时相、从单一数据源到多源数据融合不断进步。利用遥感技术对火灾发生区域进行制图分析,既可以实现高效快速评估灾后损失,还可以在大尺度范围内持续对植被恢复状况进行监测与评估,但现有的火烧迹地提取依旧存在数据不准确,精度差,尺度小的问题。

发明内容

针对上述存在的问题,本发明提出了一种基于云计算平台和随机森林算法的火烧迹地提取方法,基于长时序逐年的Landsat影像数据以及野外调查样点数据,将随机森林算法应用到火烧迹地提取方法中,实现了逐年、高精度、大尺度上的火烧迹地提取,在时间尺度上对火烧迹地进行动态监测,同时实现了基于GoogleEarthEngine云计算平台,可以快速获取影像质量高的合成遥感数据,显著提高了用户的研究和工作效率,最终实现了大尺度、长时序火烧迹地快速、自动的提取。

为了实现上述的目的,本发明采用以下的技术方案:

一种基于云计算平台和随机森林算法的火烧迹地提取方法,包括如下步骤:

步骤1)遥感数据获取、预处理及构建时间序列影像数据集;

步骤2)构建火烧迹地样本库;

步骤3)划分样点数据;

步骤4)特征向量提取及建立时间序列特征向量影像集;

步骤5)构建随机森林模型并优化模型;

步骤6)火烧迹地提取结果精度评价;

步骤7)火烧迹地制图。

优选的,步骤1)中遥感数据获取及预处理具体操作为:

S1、基于GoogleEarthEngine平台,获取Landsat系列影像,包括Landsat5、Landsat7和Landsat8地表反射率影像产品;

S2、对获取的影像进行如下处理:去除影像中云、阴影等无效观测值;去除影像中的地形阴影;去除Landsat7影像中的条带误差;利用光谱值之间的统计协调函数对OLI和TM/ETM+传感器反射率进行归一化处理。

优选的,步骤1)中构建时间序列影像数据集中具体操作为:基于GoogleEarthEngine平台提供的中值影像合成方法,对预处理后的影像数据,逐年合成高质量影像,得到长时间序列高质量影像数据集。

优选的,步骤2)具体操作为:基于GoogleEarthEngine云平台,根据步骤1)中得到的时间序列影像数据集,对火烧迹地进行人工样本点选择,并与野外调查样本点进行合并,生成火烧迹地样本库。

优选的,步骤3)的具体操作为:将步骤2)中得到的火烧迹地样本库划分为训练数据集和验证数据集;将所有样本数据按照70%:30%的比例随机分配到两个数据集合中的一个;对训练数据集进行子集化,其中80%的数据用于训练单独的分类算法,20%的数据用于优化模型;验证数据集用于对后续的最终样本数据分类结果进行评价。

优选的,步骤4)具体操作为:基于GoogleEarthEngine平台,计算影像的特征向量,(1)光谱指数特征向量,归一化植被指数NDVI、增强植被指数EVI、燃烧面积指数BAI、改进的归一化水体指数MNDWI、归一化燃烧指数NBR和归一化燃烧指数NBR2;(2)K-T变换主要分量,亮度TCB、绿度TCG和湿度TCW;最终,建立时间序列特征向量数据集,相关指数的计算公式如下:

NDVI=(NIR-RED)/(NIR+RED)

EVI=2.5*(NIR-RED)/(NIR+6RED-7.5BLUE+1)

BAI=1/[(0.1-RED)

MNDWI=(GREEN-SWIR2)/(GREEN+SWIR2)

NBR=(NIR-SWIR2)/(NIR+SWIR2)

NBR2=(SWIR1-SWIR2)/(SWIR1+SWIR2)

TCB=(0.3029*BLUE)+(0.2786*GREEN)+(0.4733*RED)

+(0.5599*NIR)+(0.508*SWIR1)+(0.1872*SWIR2)

TCG=(-0.2941*BLUE)-(0.243*GREEN)-(0.5424*RED)

+(0.7276*NIR)+(0.0713*SWIR1)-(0.1608*SWIR2)

TCW=(0.1511*BLUE)+(0.1973*GREEN)+(0.3283*RED)

+(0.3407*NIR)-(0.7117*SWIR1)-(0.4559*SWIR2)

优选的,步骤5)具体操作为:在GoogleEarthEngine云平台构建随机森林模型,设定生长树的数目和节点分裂时输入的特征变量个数,通过计算OOB误分率调整上述两个参数的设置,得到最优模型,根据步骤四中的9个特征向量结果进行监督分类,得到火烧迹地空间分布信息。

优选的,步骤6)具体操作为:利用步骤3)中的验证数据集针对模型分类结果进行精度评价,通过计算用户精度、生产者精度、总体精度以及Kappa系数来评估火烧迹地提取结果的精度。

优选的,步骤7)具体操作为:将随机森林模型输出结果下载至本地处理器,导入到ArcGIS中进行制图处理。

由于采用上述的技术方案,本发明的有益效果是:本发明基于长时序逐年的Landsat影像数据以及野外调查样点数据,将随机森林算法应用到火烧迹地提取方法中,实现了逐年、高精度、大尺度上的火烧迹地提取,在时间尺度上对火烧迹地进行动态监测,同时实现了基于GoogleEarthEngine云计算平台,可以快速获取影像质量高的合成遥感数据,显著提高了用户的研究和工作效率,最终实现了大尺度、长时序火烧迹地快速、自动的提取。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的,保护一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明的流程图;

图2为本发明实施例2的火烧迹地空间分布图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述。基于本发明的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例1

如图1-图2所示,一种基于云计算平台和随机森林算法的火烧迹地提取方法,包括如下步骤:

步骤1)遥感数据获取、预处理及构建时间序列影像数据集:

S1、基于GoogleEarthEngine平台,获取Landsat系列影像,包括Landsat5、Landsat7和Landsat8地表反射率影像产品;

S2、对获取的影像进行如下处理:去除影像中云、阴影等无效观测值;去除影像中的地形阴影;去除Landsat7影像中的条带误差;利用光谱值之间的统计协调函数对OLI和TM/ETM+传感器反射率进行归一化处理;

S3、构建时间序列影像数据集中:基于GoogleEarthEngine平台提供的中值影像合成方法,对预处理后的影像数据,逐年合成高质量影像,得到长时间序列高质量影像数据集。

步骤2)构建火烧迹地样本库:基于GoogleEarthEngine云平台,根据步骤1)中得到的时间序列影像数据集,对火烧迹地进行人工样本点选择,并与野外调查样本点进行合并,生成火烧迹地样本库;

步骤3)划分样点数据:将步骤2)中得到的火烧迹地样本库划分为训练数据集和验证数据集;将所有样本数据按照70%:30%的比例随机分配到两个数据集合中的一个;对训练数据集进行子集化,其中80%的数据用于训练单独的分类算法,20%的数据用于优化模型;验证数据集用于对后续的最终样本数据分类结果进行评价;

步骤4)特征向量提取及建立时间序列特征向量影像集:基于GoogleEarthEngine平台,计算影像的特征向量,(1)光谱指数特征向量,归一化植被指数NDVI、增强植被指数EVI、燃烧面积指数BAI、改进的归一化水体指数MNDWI、归一化燃烧指数NBR和归一化燃烧指数NBR2;(2)K-T变换主要分量,亮度TCB、绿度TCG和湿度TCW;最终,建立时间序列特征向量数据集,相关指数的计算公式如下:

NDVI=(NIR-RED)/(NIR+RED)

EVI=2.5*(NIR-RED)/(NIR+6RED-7.5BLUE+1)

BAI=1/[(0.1-RED)

MNDWI=(GREEN-SWIR2)/(GREEN+SWIR2)

NBR=(NIR-SWIR2)/(NIR+SWIR2)

NBR2=(SWIR1-SWIR2)/(SWIR1+SWIR2)

TCB=(0.3029*BLUE)+(0.2786*GREEN)+(0.4733*RED)

+(0.5599*NIR)+(0.508*SWIR1)+(0.1872*SWIR2)

TCG=(-0.2941*BLUE)-(0.243*GREEN)-(0.5424*RED)

+(0.7276*NIR)+(0.0713*SWIR1)-(0.1608*SWIR2)

TCW=(0.1511*BLUE)+(0.1973*GREEN)+(0.3283*RED)

+(0.3407*NIR)-(0.7117*SWIR1)-(0.4559*SWIR2)

步骤5)构建随机森林模型并优化模型:在GoogleEarthEngine云平台构建随机森林模型,设定生长树的数目和节点分裂时输入的特征变量个数,通过计算OOB误分率调整上述两个参数的设置,得到最优模型,根据步骤四中的9个特征向量结果进行监督分类,得到火烧迹地空间分布信息;

步骤6)火烧迹地提取结果精度评价:利用步骤3)中的验证数据集针对模型分类结果进行精度评价,通过计算用户精度、生产者精度、总体精度以及Kappa系数来评估火烧迹地提取结果的精度;

步骤7)火烧迹地制图:将随机森林模型输出结果下载至本地处理器,导入到ArcGIS中进行制图处理。

本发明基于长时序逐年的Landsat影像数据以及野外调查样点数据,将随机森林算法应用到火烧迹地提取方法中,实现了逐年、高精度、大尺度上的火烧迹地提取,在时间尺度上对火烧迹地进行动态监测,同时实现了基于GoogleEarthEngine云计算平台,可以快速获取影像质量高的合成遥感数据,显著提高了用户的研究和工作效率,最终实现了大尺度、长时序火烧迹地快速、自动的提取。

实施例2

用实施例1的方法提取1986-2020年漠河市及塔河县火烧迹地空间分布信息,包括以下步骤:

步骤1)遥感数据获取:

基于GoogleEarthEngine平台,获取1986-2020年Landsat系列影像,包括Landsat5、Landsat7和Landsat8地表反射率影像产品,在GEE云平台上根据“LANDSAT/LT05/C01/T1_SR”、“LANDSAT/LE07/C01/T1_SR”和“LANDSAT/LC08/C01/T1_SR”影像集ID进行调用,共计获得2333幅影像;

步骤2)影像预处理:

对获取的影像进行如下的处理:1、利用影像中的QA波段去除影像中的云、阴影等无效观测值;2、利用阴阳坡归一化处理方法去除影像中的地形阴影;3、利用焦点统计方法去除Landsat7影像中的条带误差;4、利用光谱值之间的统计协调函数对OLI和TM/ETM+传感器反射率进行归一化处理;

步骤3)构建时间序列影像数据集:

基于GoogleEarthEngine平台使用ee.ImageCollection.median和ee.ImageCollection.clip命令,对预处理后的影像数据进行中值合成,并按照研究区范围进行裁剪,得到长时间序列逐年高质量影像数据集;

步骤4)构建火烧迹地样本库:

基于GoogleEarthEngine云平台,根据步骤1)中得到的时间序列影像数据集,对火烧迹地进行人工样本点选择,并与野外调查样本点进行合并,生成火烧迹地样本库;

步骤5)划分样点数据:

将火烧迹地样本库划分为两个数据集:训练数据集和验证数据集;将所有样本数据按照70%:30%的比例随机分配到两个数据集合中的一个;对训练数据集进行子集化,其中80%的数据用于训练单独的分类算法,20%的数据用于优化模型;验证数据集用于对后续的最终样本数据分类结果进行评价;

步骤6)特征向量提取及建立时间序列特征向量影像集:

基于GoogleEarthEngine平台,计算影像的特征向量,主要包括:1、光谱指数特征向量,归一化植被指数NDVI、增强植被指数EVI、燃烧面积指数BAI、改进的归一化水体指数MNDWI、归一化燃烧指数NBR和归一化燃烧指数NBR2;2、K-T变换主要分量,亮度TCB、绿度TCG和湿度TCW;最终,建立时间序列特征向量数据集,相关指数的计算公式如下:

NDVI=(NIR-RED)/(NIR+RED)

EVI=2.5*(NIR-RED)/(NIR+6RED-7.5BLUE+1)

BAI=1/[(0.1-RED)

MNDWI=(GREEN-SWIR2)/(GREEN+SWIR2)

NBR=(NIR-SWIR2)/(NIR+SWIR2)

NBR2=(SWIR1-SWIR2)/(SWIR1+SWIR2)

TCB=(0.3029*BLUE)+(0.2786*GREEN)+(0.4733*RED)

+(0.5599*NIR)+(0.508*SWIR1)+(0.1872*SWIR2)

TCG=(-0.2941*BLUE)-(0.243*GREEN)-(0.5424*RED)

+(0.7276*NIR)+(0.0713*SWIR1)-(0.1608*SWIR2)

TCW=(0.1511*BLUE)+(0.1973*GREEN)+(0.3283*RED)

+(0.3407*NIR)-(0.7117*SWIR1)-(0.4559*SWIR2)

步骤7)构建随机森林模型并优化模型:

在GoogleEarthEngine云平台构建随机森林模型,设定生长树的数目和节点分裂时输入的特征变量个数,通过计算OOB误分率调整上述两个参数的设置,设置生长树的数目和节点分裂时输入的特征变量个数分别为500和6时得到最优模型,根据步骤4)中的9个特征向量结果进行监督分类,得到火烧迹地空间分布信息;

步骤8)火烧迹地提取结果精度评价:

利用验证数据集针对模型分类结果进行精度评价,计算用户精度、生产者精度、总体精度以及Kappa系数分别为94.50%、88.79%、90.50%和0.81;

步骤9)火烧迹地制图:

将随机森林模型输出结果下载至本地处理器,导入到ArcGIS中进行制图处理,从而得到1986-2020年漠河市及塔河县的火烧迹地空间分布信息。

在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料过着特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号