一、技术领域
本发明涉及松材线虫数据处理和空间格网化领域,特别涉及一种基于地理加权回归面 到点克里金插值(GWRK)模型的病虫害成灾率降尺度格网化。
二、技术背景
松材线虫自1982年传入我国以来,造成了严重的经济和生态损失达上千亿元,世界上 还没有可行有效的防治措施。对松材线虫病发生林区的监测主要是通过人工现场抽样检测、 遥感技术以及无人机技术进行监测。
目前空间降尺度与数据格网化方法多基于人口、经济数据格网化精细研究,对于病虫 害成灾率格网化结果较为粗糙。将松材线虫病成灾率格网化,能够得到较小空间尺度上的特 征信息,达到对松材线虫病成灾率识别、监测、预测、防控的目的。
三、发明内容
(一)要解决的技术问题
本发明首先要解决的技术问题是:如何克服传统的格网化方法无法考虑其他影响因子 对病虫害成灾率的影响和尺度下推所产生的残差对尺度下推结果准确性的影响,提供更精细 尺度的松材线虫成灾率的格网化数据。
(二)技术方案
为解决上述技术问题,本发明提供一种松材线虫病成灾率的空间格网化方法包括以下 步骤:
一种松材线虫病成灾率的空间格网化方法,包括如下步骤:
S1、获取松材线虫病疫区发生面积、发病率数量统计。
S2、获取影响松材线虫发病率分布的影响因子数据作为辅助数据。
S3、对松材线虫发病率数据及各影响因子数据进行预处理,构建影响因子模型。
S4、基于地理加权回归面到点克里金模型,首先基于地理加权回归模型构建松材线虫 发病率与影响因子间的回归关系,并将回归关系应用至格网尺度形成松材线虫发病率格网。
S5、获取加权回归后的残差项,用面到点克里金插值方法对其进行尺度下推。
S6、将克里金插值结果与回归结果相加。得到精细格网下的高分辨率松材线虫发病率 数据。
优选地,步骤S2中,影响因子数据,包括气象数据(气温数据,降水数据,气压数据,风速数据),交通数据,遥感数据(植被指数数据),人口分布数据,高程数据,河流分 布数据,土地利用数据,松墨天牛灾害数据。
优选地,步骤S3中,对各影响因子数据及松材线虫发病率数据进行预处理,包括以下步骤:
(1)松材线虫发病率数据及各影响因子数据应在时间和空间尺度上具有匹配性。
(2)设置制图网格的分辨率,将数据通过重采样匹配到对应的网格上,形成具有统一空间分 辨率的栅格数据。
(3)根据影响因子相关性用主成分分析的方法,对气温数据,降水数据,气压数据,风速数 据进行计算,得到气象影响因子;对人口分布数据,交通数据进行计算,得到人为影响因子; 对遥感数据(植被指数数据),松墨天牛灾害数据进行计算,得到植被影响因子;高程数据为 地形影响因子。
优选地,步骤S4中,根据基于地理加权回归面到点克里金(GWRK)模型,首先基于地理加权回归模型(GWR)构建松材线虫发病率与影响因子间的回归关系,并将回归关系应用至 格网尺度形成松材线虫发病率格网。GWR区别于传统回归方法在于使用了临近观测值进行局 部加权回归而非全局信息所获得的常量进行预测,并结合数据点空间位置。本方法中选择高 斯函数作为空间权重函数,可以很好地显示松材线虫发病率分布状况。计算过程表达式为:
式中y
优选地,步骤S5中,获取GWR回归的残差项ε,并对其进行克里金插值。实际计算中回归残差会存在误差,可以对其进行插值,以减少形成GWRK模型的最终残差。计算过程表达式如下:
y
式中,y
优选地,步骤S6中,所述的一种松材线虫病成灾率的空间格网化方法,其中将克里金 残差结果与回归预测结果相加即可得到GWRK结果。
(三)有益效果:
上述技术方案有如下优点:本发明通过地理加权回归面到点克里金插值方法结合,充 分考虑了地表变量空间位置、空间相关性特征与残差项,利用降尺度思路将松材线虫发病率 统计值进行地理回归分析,并对其残差项进行面-点克里金插值,提供较好的松材线虫分布细 节信息。选取了多项数据作为影响因子进行加权融合,克服了单一变量进行大幅度尺度下推 时精度降低的问题,提高松材线虫发病率格网化数据的质量。运用该方法为松材线虫以及其 他病虫害数据的格网化提供了思路与方法,提高识别松材线虫病成灾区的准确率,达到对松 材线虫病成灾率识别、监测、预测、防控的目的,进而对松材线虫病进行快速的防治,节省 大量物力财力。
四、附图说明
下面结合附图对本发明进一步说明:
图1为一种松材线虫病成灾率的空间格网化方法的流程图。
图2为各影响因子数据。
五、具体实施方式
下面结合附图,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本 发明,但不用来限制本发明的范围。
步骤S1:数据获取及预处理。
考虑到计算效率以及覆盖范围的精确度,并能够与已收集数据相匹配,设置制图网格 的分辨率大小,以便其他数据重采样。
1.获取研究区松材线虫病疫区发生面积或发病率数量统计,通过ARCGIS软件将数据转 化为栅格单元。可采用两种方法对松材线虫病成灾率数据进行显示,一种为将研究区范围内 的所有栅格值赋为松材线虫发生面积数(或发病率)除以研究区栅格总数,即在研究区中所 有栅格值相同;另一种方法为获取针叶林分布数据(松材线虫病感染树种),针叶林分布的地 方栅格值赋为松材线虫发生面积数(或发病率)除以针叶林分布栅格总数。将该数据通过重 采样匹配到对应的网格中。
2.获取研究区,气象数据包括气温数据,降水数据,气压数据,风速数据,气象数据预处理包括数据检查和异常值去除,对符合正态分布的数据采用克里金方法插值。将该数据 通过重采样匹配到对应的网格中。
3.获取研究区交通数据,包括铁路、公路数据,高程数据,河流分布数据,松墨天牛灾害数据,将该数据通过重采样匹配到对应的网格中。
4.获取研究区植被指数遥感数据,将该数据通过重采样匹配到对应的网格中。
5.获取松墨天牛灾害数据,将松墨天牛发生灾害的栅格单元赋值为研究区松墨天牛发 生面积(或发生率)除以研究区栅格总数,即灾害发声单元栅格值相同。将该数据通过重采 样匹配到对应的网格中。
6.经上述预处理过程后,所有数据为具有统一的分辨率的栅格数据。
步骤S2:根据其相关性用主成分分析的方法,对气温数据,降水数据,气压数据,风速数据进行计算,得到气象影响因子;对人口分布数据,GDP数据,交通数据进行计算,得 到人为影响因子;对植被指数遥感数据,松墨天牛灾害数据进行计算,得到植被影响因子; 高程数据为地形影响因子。
步骤S3:以气象影响因子,人为影响因子,植被因素因子,地形影响因子为解释变量, 各区县松材线虫发病率为因变量,采用基于OLS的全局回归(GR)方法进行逐步回归分析。 若解释变量的回归系数均达到了显著水平(P<0.05),且方差膨胀因子(VarianceInflation Factor,VIF)均远小于10,说明各解释变量间基本不存在多重共线性问题,回归分析的结 果是可靠的。
步骤S4:基于地理加权回归面到点克里金(GWRK)模型,首先将预处理后的各影响因 子与松材线虫发病率进行地理加权回归(GWR)分析。GWR模型区别于传统回归方法在于使用 了临近观测值进行局部加权回归而非全局信息所获得的常量进行预测,并结合数据点空间位 置。本方法中选择高斯函数作为空间权重函数,可以很好地显示松材线虫发病率分布状况。 计算过程表达式为:
式中y
步骤S5:获取加权回归后的残差项,用面到点克里金插值方法(ATARK)对其进行尺度下推。获取GWR回归的残差项ε,并对其进行克里金插值。如果GWR回归模型是完美的, 并且在低分辨率模型中没有观测误差,回归系数则无误差且随机残差R值为0。实际计算中 回归残差会存在误差。如果残差具有空间结构,可以对其进行插值,以减少形成GWRK模型的最终残差。计算过程表达式如下:
y
式中,y
步骤S6:将克里金插值结果与回归结果相加。得到精细格网下的高分辨率松材线虫发 病率数据。
机译: 松材线虫病病媒诱捕剂的组成及控制方法
机译: 纺织混凝土格栅格网元件,一种生产这种混凝土格栅格网的装置以及一种利用这种装置生产混凝土格网格栅的方法
机译: 纺织混凝土格栅格网元件,一种生产这种混凝土格栅格网的装置以及一种利用这种装置生产混凝土格网格栅的方法