首页> 中国专利> 一种基于降雨径流相似性的自适应径流预报方法

一种基于降雨径流相似性的自适应径流预报方法

摘要

本发明公开了一种基于降雨径流相似性的自适应径流预报方法,采用数据挖掘技术在历史降雨产流过程中搜索相似过程,预测后期径流最可能的过程线;包括:S1、构建历史降雨、径流样本;S2、降雨、径流关键特征指标识别;S3、基于数据挖掘的降雨、径流相似性动态评价;S4、基于雨洪相似性的径流滚动预测;S5、预报模式自适应切换。本发明既能克服物理驱动径流预报模型参数率定困难的问题,又能突破常规数据驱动径流预报模型预报结果可解释性差的难题,一定程度上突破了径流预报精度低和预见期短的瓶颈,对提高流域水库群精细化管理及精益化调度水平具有重要意义。

著录项

说明书

技术领域

本发明涉及径流预报技术,特别是涉及一种基于降雨径流相似性的自适应径流预报方法。

背景技术

径流预报是防洪减灾、水资源保障、电力生产等流域管理决策的关键依据,也是全球变化下水文水资源领域研究的前沿热点。目前广泛使用的径流预报模型分为物理驱动模型和数据驱动模型,其中物理驱动模型注重过程推演,而数据驱动模型注重结果逼近,两种模型在基本原理上存在本质差别。

物理驱动的径流预报模型从径流的物理成因出发,用一系列含参数的数学物理方程描述从产流、到汇流、再到河道演进的完整过程,涉及的研究内容包含大气气象、河道、土壤、地下水等复杂系统,方程参数都具有严谨的物理意义。为减少建模难度,常见的物理驱动模型都是区域性的、季节性的,例如:Mishra等建立退水模型进行青尼罗河的枯季退水径流预报,并取得了良好的成果。李晓等将SWAT模型应用于伊河上游的径流模拟,在干旱、湿润以及半干旱半湿润气候条件下具有较好的模拟效果。也有采用智能算法对模型进行参数寻优的研究,例如:江燕等运用粒子群算法对新安江模型参数进行优选,结果表明,与单纯形混合加速算法、单纯多边形进化算法等相比,粒子群算法显著提高了计算效率和预报精度。

近年来,随着人工智能与大数据技术的快速发展,数据驱动的径流预报模型逐渐成熟,它是以建立输入和输出数据之间最优数学关系为目标的黑箱模型,因此,模型不必考虑径流的物理成因,但是需要长期的、海量的流域水文测站数据作为支撑。例如:Sajikuamar等人采用多层次前向网络及回归网络进行月径流预报。Avinash Agarwal,R.D.Singh建立了多层BP网络来模拟印度Narmada河的降雨-径流过程。实际上,特定地域内洪水发生的时间和量级具有周期变化的特征,历史洪水一定程度上包含了当地天气系统和下垫面变化的信息,因此,当具有较长时间、较多场次的历史洪水系列时,采用数据挖掘技术,找出相似洪水,“参考过去预测未来”考即根据历史上相似洪水提供的信息预测未来洪水的有关特征,或参考历史上相似洪水的处理方案构建未来洪水的处理方案,这对未来洪水的防洪决策具有重要意义。

发明内容

发明目的:本发明的目的是提供一种基于降雨径流相似性的自适应径流预报方法,接入实时降雨预报信息,滚动预报未来一周的径流,在此基础上识别前期降雨径流特征,自动切换预报模式,实现自适应不同预报场景的功能。

技术方案:本发明的基于降雨径流相似性的自适应径流预报方法,包括以下步骤:

S1、构建历史降雨、径流样本:收集预报对象所在流域的关键断面流量数据,以及雨量站点数据和格点数据,对收集的原始数据进行时间降维和空间降维,得到历史降雨、径流样本;

S2、降雨、径流关键特征指标识别:基于历史降雨、径流样本,分析预报断面所在流域的降雨、径流特征并建立预报断面及以上流域降雨、径流定量特征指标;从径流的物理成因和统计分析两个方面综合确定降雨、径流的关键特征指标;

S3、基于数据挖掘的降雨、径流相似性动态评价:采用滑动窗口取样的方式构建历史实测降雨、径流、以及预报降雨的关键特征指标样本集,运用欧氏距离法等方法定量表征当前样本与历史样本的降雨相似性和径流相似性,并考虑到降雨、径流数值量级差异,提出考虑降雨影响权重的降雨-径流综合相似性指标;搜索最相似的多场历史实测降雨径流过程,并以此作为得出最终预报结果的依据;

S4、基于雨洪相似性的径流滚动预测:构建多因子最近邻抽样回归模型,利用雨洪相似性对流域径流进行预测,结合遗传算法等现代启发式算法,以实现预报效果最优化为目标,对模型涉及到的最近邻数、关键特征矢量维数、降雨影响权重等参数进行优化;为了延长径流预报预见期,滚动接入未来降雨预报信息,提出多种滚动预报模式对径流进行滚动预测,预报结果包括流量最可能的过程线;

S5、预报模式自适应切换:针对流域在涨退水不同阶段的产汇流特性,建立根据实时水雨情自适应切换的降雨、径流输入模式,进一步提高径流预报精度。

进一步的,步骤S1中,从空间和时间两个尺度对数据进行降维具体为:

在时间尺度上,将收集到的降雨、径流资料转化为预报需求的时段;

在空间尺度上,通过分析流域的自然地理特征和降雨空间分布规律,将流域划分为几个区域,将区域内的雨量站点数据转化为分区面雨量数据,对多个站点的降雨监测数据进行降维;首先根据不同区域产汇流模式差异,将研究区域划分为若干个子区域,子区域面雨量通过所含站点雨量加权平均计算,计算公式为:

其中,P

进一步的,步骤S2中基于历史降雨、径流样本资料,分析预报断面所在流域的降雨、径流特征并建立预报断面及以上流域降雨、径流定量特征指标;根据流域径流的物理成因和特征指标,综合利用成因分析、相关性分析、回归分析、多因子综合分析方法,识别流域不同空间位置,在不同预报时间尺度和不同预报时期的预报关键特征指标;并综合利用物理成因分析和数理统计方法确定关键特征指标的前期影响滞时,具体为:

S21、从降雨、径流物理成因出发,综合分析各区域降雨到预报断面的产汇流时间,初步确定降雨、径流的响应时间,把响应时间作为确定关键指标前期影响滞时的重要依据;

S22、运用数理统计方法,分析不同前期影响滞时的降雨、径流与预测时段径流的相关性,选出相关性较大的前期影响滞时;

S23、基于初步确定的前期影响滞时,设置考虑不同前期影响滞时的降雨、径流组合作为识别相似径流过程的关键指标,采用降雨径流相似性预报模型对流域断面的历史径流过程进行预报,根据预报结果精度评价最终确定最优的前期影响滞时。

另外,根据不同的预报场景识别不同的降雨、径流关键特征指标,一般径流过程可分为涨水阶段和退水阶段,分别识别合适的前期影响滞时,建立适用于涨水规律和退水规律的径流预报模式,预报模型根据前期径流和预报降雨情况,自动切换预报模式。

进一步的,步骤S3中,采用滑动窗口取样的方式,构建关键特征指标样本集,以丰富历史降雨、径流样本的数量;并采用欧氏距离法定量表征当前降雨、径流样本和历史降雨、径流样本的相似性;考虑降雨和径流数值量级差异,提出降雨影响权重的降雨-径流综合相似性指标;以此作为描述实时降雨径流样本与历史降雨径流样本相似性强弱的关键指标。

其中,降雨相似性指标为:

其中,P

径流相似性指标为:

其中,Q

降雨-径流综合相似性指标,即降雨-径流综合欧氏距离d

d

其中,w

进一步的,步骤S4中,构建多因子最近邻抽样回归模型,利用雨洪相似性对流域径流进行预测,并结合现代启发式算法,以实现预报效果最优化为目标,对模型涉及到的最近邻数、关键特征矢量维数、降雨影响权重参数进行优化;

基于确定的降雨-径流综合相似性指标计算当前降雨、径流样本与每一个历史降雨、径流样本的相似性程度,基于相似性指标排序选择相似性样本,并计算每个相似性样本在未来径流预报中的权重为;

其中,k为历史降雨、径流样本中的相似性样本个数,w

确定相似性样本及其权重之后,径流预报结果由下式表示:

其中,

采用多因子最近邻抽样回归模型(NNBR)进行径流相似性预报,模型涉及到的参数主要有:最近邻抽样数、特征矢量的维数、降雨影响权重等。其中最近邻抽样数是指预报模型在历史过程中搜索抽样的样本个数;特征矢量维数与关键特征指标对径流的影响滞时密切相关;降雨影响权重是为了平衡降雨、径流量级差异。

基于《水文情报预报规范》,选取纳什系数NS、平均相对误差MARE作为评价指标,建立预报结果精度评价指标体系,对不同预见期的预报效果进行综合评定;以预报效果最优为目标,结合遗传算法等现代启发式优化算法,对每一种关键特征指标组合方案单独建模和参数率定;以纳什系数NS最大为目标的目标函数为:

以平均相对误差MARE最小为目标的目标函数为:

其中,n表示训练期的长度,共n个时段,

进一步的,步骤S4中为了延长预见期,本发明接入降雨预报信息,提出三种滚动预报方法,实现预见期内逐时段的滚动预报;三种滚动预报方法为:

S41、不考虑降雨预报和径流预报;

直接根据已经发生的、实测的降雨和径流信息寻找降雨、径流相似过程,这种方式不考虑预报降雨,因此当预报降雨的长度不足或者精度较差时,采用这种滚动方法;预测t~t+m时段的径流过程为:

其中,

S42、考虑降雨预报信息滚动更新降雨相似性;

不断加入预测的流量信息作为输入滚动更新径流相似性,继续预报下一时段的径流;这种滚动方法完全接入预报降雨,并且上一时段的预报结果会影响下一时段的预报结果;所以当预报降雨长度足够并且精度较高时,采用这种滚动方式;预测t~t+m时段的径流过程为:

其中,预报t时段的径流Q′

S43、考虑降雨预报信息滚动更新降雨相似性,但是不更新径流相似性;

预报模型考虑降雨预报信息的更新,但是考虑到上一时段的预报径流存在误差,因此只滚动更新降雨相似性,这种滚动方式兼有上述S41和S42的两种滚动方式的特点;预测t~t+m时段的径流过程为:

其中,预报t时段的径流Q′

进一步的,步骤S5中,针对预报对象所在流域在涨水、退水等不同径流发展阶段产汇流机理的差异,建立能够根据前期水文条件自适应切换的预报模式。例如,在涨水阶段,前期的累计降雨能够较早使土壤达到饱和,在后续的发展过程中,相同量级的降雨将导致更加显著的径流上涨过程。考虑到前期降雨影响滞时的不同,提出短降雨滞时和长降雨滞时模式,短降雨滞时模式主要适合降雨稀少,雨量较小的时期,这一时期径流的自相关性较高。长降雨滞时模式更适合降雨频繁、雨量较大的时期,尤其是流域汛期的涨水阶段。根据前期径流、前期降雨、预报降雨等综合因素,提出不同预报模式之间的切换条件,当满足切换条件时,预报模型将自动切换到相应的预报模式。

有益效果:与现有技术相比,本发明具有以下优点:

(1)克服了物理驱动径流预报模型参数率定困难的问题。物理驱动径流预报模型从洪水的物理成因出发,预报精度很大程度上取决于模型参数的取值,但是当流域自然地理环境或产汇流条件复杂时,面临模型参数率定困难的问题。相似性预报模型中的涉及的参数数量远少于物理驱动径流预报模型,而且参数率定比较简单;

(2)克服了常规数据驱动径流预报模型预报结果可解释性差的问题。常规数据驱动径流预报模型,如人工神经网络、支持向量机等,是以建立输入输出数据最优数学关系为目标的黑箱子方法,无法解释降雨、径流物理成因。相似性预报模型的预报结果可以通过相似性样本回溯到历史上真实发生的径流过程,所以模型可以清楚地解释每一条预报结果。除此之外,相似性预报模型的预报结果还能够为调度决策提供历史依据。根据当前的降雨和断面流量信息,寻找历史上相似的过程,从而提供面对相似情况的调度策略,为决策者提供决策支持;

(3)一定程度上突破了径流预报精度低和预见期短的瓶颈。以大渡河干流的丹巴断面为例,基于相似性原理建立径流预报模型,预见期3天的纳什系数大于0.8,平均相对误差小于10%,预报结果的准确率超过90%;预见期7天的纳什系数大于0.6,平均相对误差小于20%,预报结果的准确率超过80%。

具体实施方式

下面结合具体实施例对本发明进行详细说明。

本发明的基于降雨径流相似性的自适应径流预报方法,包括以下步骤:

S1、资料收集与处理;

收集预报对象所在流域的水情测报系统中控制性雨量站和水文站的历史实测降雨、径流过程信息,构建历史降雨、径流样本库。对于降雨资料,需要同时收集水情测报系统的实测降雨数据、来自气象部门的滚动预报降雨数据、以及中国气象局发布的格点降雨数据,分析来自水情测报系统中控制性雨量站的数据和格点降雨数据的可靠性,选择合适的数据源评价降雨相似性。对于径流资料,当预报对象上游无水利工程时,收集预报对象以上干支流关键水文站的径流资料;当预报对象以上有水利工程时,还需要收集上游水库的出、入库流量资料,作为反推区间洪水资料的依据。

从枯、汛期径流量级差异,以及降雨、径流响应关系,辅助判断降雨和径流数据异常情况。充分利用中国气象局发布的历史天气数据,以及站网监测数据和气象格点数据对降雨数据进行校核;充分利用上、下游水文站点监测数据,以及水文、流量数据对径流数据进行校核。对于数据异常较少的时段,可采用插值等方式覆盖原有异常数据;对于数据异常较多的时段,应标记该时段并不纳入降雨、径流历史样本中,避免因数据异常导致的预报结果偏差。

S2、构建降雨、径流样本;

在时间尺度上,需要将收集到的降雨、径流资料转化为预报需求的时间尺度。对于集水面积较小的支流区域,洪水一般具有陡涨陡落特性,预报的预见期不宜过长,但是预报尺度应该精细化。对于集水面积较大的干流区域,场次洪水持续时间较长,掌握更长预见期的洪水信息对协调水库的兴利效益和防洪风险至关重要,可选择较粗的预报尺度对较长预见期的洪水涨退水规律进行预测。

在空间尺度上,研究通过将雨量站点数据转化为分区面雨量数据,对多个站点的降雨监测数据进行降维。首先根据不同区域产汇流模式差异,将研究区域划分为若干个子区域,子区域面雨量通过所含站点雨量加权平均计算,计算公式为:

其中,P

S3、预报模型建立;

S31、降雨、径流关键特征指标识别;

基于历史降雨、径流样本资料,分析预报对象所在流域的降雨、径流特征并建立预报对象及以上流域的降雨、径流定量特征指标。降雨过程可分为两个阶段:发展阶段和结束阶段。发展发展阶段的特征指标主要有前期累计降雨量、时段降雨量等;结束阶段的特征指标主要有降雨历时、总降雨量、雨量等级等。径流过程也可同样分为发展阶段和结束阶段:发展阶段的特征指标有时段径流量、累计时段径流量等;结束阶段的特征指标有峰型、峰值流量、峰现时间等。

根据径流的物理成因和上述特征指标,综合利用成因分析、相关性分析、回归分析、多因子综合分析等方法,对历史降雨、径流数据进行深度挖掘分析,初步识别流域不同空间位置(上游、中游或下游),在不同预报时间尺度(年、月、旬、日)和不同预报时期(汛期、枯期、枯汛转换期等)的预报关键特征指标。本发明综合利用物理成因分析和数理统计方法确定关键特征指标的前期影响滞时:

a、从降雨、径流物理成因出发,综合分析各区域降雨到预报断面的产汇流时间,初步确定降雨、径流的响应时间,把响应时间作为确定关键特征指标前期影响滞时的重要依据;

b、运用数理统计方法,分析不同前期影响滞时的降雨、径流与预测时段径流的相关性,选出相关性较大的前期影响滞时;

c、基于初步确定的前期影响滞时,设置考虑不同前期影响滞时的降雨、径流组合作为识别相似径流过程的关键指标,采用降雨径流相似性预报模型对流域断面的历史径流过程进行预报,根据预报结果精度评价最终确定最优的前期影响滞时。

对于待选的关键特征指标x,假设确定的前期影响滞时为3个时段,则相似性预报模型需要考虑如下的滞时组合:

a.x

b.x

c.x

d.x

S32、相似性预报模型;

相似性的基本原理是:对于某一特定流域,在一定的地理环境条件下,制约降雨的主导天气系统和降雨类型会反复出现,在相似的天气系统条件下所产生的降雨(或暴雨)过程及其径流(或洪水)过程也将是相似的。降雨径流过程的形成是逐步演化的过程,主要包括天气系统的形成、降雨过程的产生、径流过程演进等各个阶段。每个阶段都有其特定的变化规律,阶段之间也存在相互的关联性。降雨径流演化过程中的这些规律,通常是以相似性的特征在历史降雨径流资料中重复出现,由此可知,在这些相似条件下产生的降雨径流及其过程也将是相似的。

根据当前降雨、径流样本,在历史降雨、径流样本中通过欧氏距离寻找最相似的数条样本,每条历史降雨、径流样本都对应一个预报结果,再根据每条降雨、径流样本的欧氏距离分配每个样本预报结果的权重,得到最终的预报结果。式(3)、(4)、(5)分别用于计算降雨相似性、径流相似性和降雨-径流综合相似性指标。

其中,P

其中,Q

d

其中,w

基于确定的降雨-径流综合相似性权重可以计算当前降雨、径流样本与每一个历史降雨、径流样本的相似性指标,基于相似性指标排序选择相似性样本,并计算各相似性样本在未来径流预测中的权重(见公式(6)和公式(7));

其中,k为历史降雨、径流样本中的相似性样本个数,w

确定相似性样本及其权重之后,径流预报结果可由下式表示:

其中,

S33、参数率定;

采用多因子NNBR模型进行径流相似性预报,预报模型涉及到的参数主要有:最近邻抽样数、特征矢量的维数、降雨影响权重等。其中,最近邻抽样数是指预报模型在历史过程中搜索抽样的样本个数;特征矢量维数与关键特征指标对径流的影响滞时密切相关;降雨影响权重是为了平衡降雨、径流量级差异。

基于《水文情报预报规范》选取纳什系数NS、平均相对误差MARE作为主要的评价指标,建立预报结果精度评价指标体系,对不同预见期的预报效果进行综合评定。结合遗传算法等现代启发式优化算法,对每一种关键特征指标组合方案单独建模和参数率定。下式(10)、(11)分别是以NS最大和MARE最小为目标的目标函数:

其中,n表示训练期的长度,共n个时段。

相似性样本权重是模型的动态参数,该参数会根据实时降雨径流场景动态变化,即在确定了降雨-径流综合相似性指标以及相似性样本数之后,相似性预报模型可动态计算每个相似性样本在未来径流预测中的权重。本发明同时采用滚动预报的方式延长预见期,通过动态识别预见期内每时段的相似过程,得到预报结果。每一个时段都根据更新的预报信息重新搜寻相似性样本,实现相似过程的动态识别。

S4、滚动预报实现;

提出三种滚动预报方式:

①不考虑降雨预报和径流预报

直接根据已经发生的、实测的降雨和径流信息寻找降雨、径流相似过程。这种方式不考虑预报降雨,因此当预报降雨的长度不足或者精度较差时,这种滚动方法更加适用。以预测t~t+m时段的径流过程为例:

其中,

②考虑降雨预报信息滚动更新降雨相似性

不断加入预测的流量信息作为输入滚动更新径流相似性,继续预报下一时段的径流。这种滚动方法完全接入预报降雨,并且上一时段的预报结果会影响下一时段的预报结果。所以当预报降雨长度足够并且精度较高时,这种滚动方式更加适用。以预测t~t+m时段的径流过程为例:

预报t时段的径流Q′

③考虑降雨预报信息滚动更新降雨相似性,但是不更新径流相似性

预报模型考虑降雨预报信息的更新,不断滚动更新降雨相似性,这种滚动方式兼有上述两种滚动方式的特点。以预测t~t+m时段的径流过程为例:

例如,预报t时段的径流Q′

S5、自适应预报模式;

针对预报对象所在流域在涨水、退水等不同径流发展阶段产汇流机理的差异,建立能够根据前期水文条件自适应切换的预报模式。例如,在涨水阶段,前期的累计降雨能够较早使土壤达到饱和,在后续的发展过程中,相同量级的降雨将导致更加显著的径流上涨过程。考虑到前期降雨影响滞时的不同,提出短降雨滞时和长降雨滞时模式,短降雨滞时模式主要适合降雨稀少,雨量较小的时期,这一时期径流的自相关性较高。长降雨滞时模式更适合降雨频繁、雨量较大的时期,尤其是流域汛期的涨水阶段。根据前期径流、前期降雨、预报降雨等综合因素,提出不同预报模式之间的切换条件,当满足切换条件时,预报模型将自动切换到相应的预报模式。

总之,本发明的基于降雨径流相似性的自适应径流预报方法,采用数据挖掘技术在历史降雨产流过程中搜索相似过程,预测后期径流最可能的过程线。包括收集流域关键断面降雨、径流资料,并在保留降雨、径流空间分布格局的前提下对数据进行时空降维;综合利用降雨径流物理成因分析和数理统计方法确定降雨、径流的关键特征指标,并权衡降雨、径流数值量级差异,提出考虑降雨影响权重的降雨-径流综合相似性指标,结合数据挖掘方法对降雨、径流相似性进行动态评价:构建多因子最近邻抽样回归模型,利用雨洪相似性对流域径流进行预测,并提出三种不同的径流滚动预报方式,以延长径流预报预见期;针对流域在涨退水等不同阶段的产汇流特性,建立可根据实时水雨情自适应切换的降雨、径流输入模式,进一步提高径流预报精度。本发明即能克服物理驱动径流预报模型参数率定困难的问题,又能突破常规数据驱动径流预报模型预报结果可解释性差的难题,一定程度上突破了径流预报精度低和预见期短的瓶颈,对提高流域水库群精细化管理及精益化调度水平具有重要意义。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号