首页> 中国专利> 基于深度学习的水流量预测模型

基于深度学习的水流量预测模型

摘要

本发明公开了一种基于深度学习的水流量预测模型,包括:顺次连接的分支网络组和第三网络;分支网络组包括并联的第一分支网络和第二分支网络;第一分支网络基于卷积神经网络以及循环神经网络构建;第二分支网络基于循环神经网络构建;第三网络基于全连接层构建;第一分支网络,用于对网格化降雨数据提取空间分布特征,并进行时序特征提取,得到第一输出特征;第二分支网络,用于对处理后流量数据进行时序特征提取,得到第二输出特征;第三网络,用于对第一输出特征以及第二输出特征进行合并并分类预测,得到目标水文站点未来P小时的流量预测值。

著录项

  • 公开/公告号CN112529270A

    专利类型发明专利

  • 公开/公告日2021-03-19

    原文格式PDF

  • 申请/专利权人 西安科锐盛创新科技有限公司;

    申请/专利号CN202011379622.1

  • 发明设计人 王琦;

    申请日2020-11-30

  • 分类号G06Q10/04(20120101);G06Q50/26(20120101);G06N3/04(20060101);G06N3/08(20060101);G06N20/00(20190101);

  • 代理机构61230 西安嘉思特知识产权代理事务所(普通合伙);

  • 代理人王海栋

  • 地址 710065 陕西省西安市高新区高新路86号领先时代广场(B座)第2幢1单元22层12202号房51号

  • 入库时间 2023-06-19 10:19:37

说明书

技术领域

本发明属于水流量预测领域,具体涉及一种基于深度学习的水流量预测模型。

背景技术

洪水是常见的自然灾害之一,每年有上亿人受洪水影响,流离失所,而洪水所造成的财力物力损失也非常巨大。有效地预测洪水流量并及时发出预警对于防洪减灾具有重大意义。

当前的基于深度学习的水流量预测模型主要分为传统物理模型和智能洪水预测模型。传统物理模型例如新安江模型,其是在充分挖掘当地的地形地貌、蒸发量、植被覆盖率等物理特征的前提下,进行物理过程的参数计算,最终制定出的一套具有区域针对性的预测模型。而智能洪水预测模型是以海量的历史数据作为先验知识,利用机器学习等智能方法得到的从输入特征到输出特征的函数映射或者联合分布。

但现有的基于深度学习的水流量预测模型多属于单点预测,即只能预测未来一个时间点的流量情况,预测得到的单个时间点的流量数据缺乏实际应用价值。并且,现有的基于深度学习的水流量预测模型在利用降雨数据时仅仅将其作为时间序列进行分析,并未考虑降雨量的空间分布情况,因此无法完全挖掘实际降雨数据所描述的信息,预测的准确性不高。

发明内容

为了解决现有技术中存在的上述问题,本发明提供了一种基于深度学习的水流量预测模型。本发明要解决的技术问题通过以下技术方案实现:

第一方面,本发明实施例提供的一种基于深度学习的水流量预测模型,包括:

顺次连接的分支网络组和第三网络;所述分支网络组包括并联的第一分支网络和第二分支网络;所述第一分支网络基于卷积神经网络以及循环神经网络构建;所述第二分支网络基于循环神经网络构建;所述第三网络基于全连接层构建;

所述第一分支网络,用于对网格化降雨数据提取空间分布特征,并进行时序特征提取,得到第一输出特征;所述网格化降雨数据基于预定流域的N个水文站点的历史K年各小时和未来P小时降雨量数据和所述N个水文站点的位置信息确定;

所述第二分支网络,用于对处理后流量数据进行时序特征提取,得到第二输出特征;所述处理后流量数据基于所述N个水文站点中位于所述预定流域的出口断面处的目标水文站点的历史K年各小时水流量数据确定;

所述第三网络,用于对所述第一输出特征以及所述第二输出特征进行合并并分类预测,得到所述目标水文站点未来P小时的流量预测值,其中,N、K和P为大于1的自然数。

可选的,所述第一分支网络包括依次连接的降维网络、特征变换网络以及多个GRU层;所述第二分支网络包括多个GRU层;所述第三网络包括concat模块以及多个全连接层。

可选的,所述网格化降雨数据以及所述处理后流量数据的构建过程包括:

获取预定流域的原始降雨数据、原始流量数据以及N个水文站点的原始位置信息;所述原始降雨数据包括所述预定流域的N个水文站点的历史K年各小时降雨数据,所述原始流量数据包括所述N个水文站点中位于所述预定流域的出口断面处的目标水文站点的历史K年各小时流量数据,所述原始位置信息包括所述N个水文站点的经度和所述N个水文站点的纬度;

将所述原始降雨数据、预先获取的未来P小时的先验降雨数据、所述原始流量数据以及所述原始位置信息进行预处理,分别得到处理后降雨数据、处理后先验降雨数据、处理后流量数据以及处理后位置信息;

基于所述处理后降雨数据、所述处理后先验降雨数据以及所述处理后位置信息,形成网格化降雨数据。

可选的,所述将所述原始降雨数据、预先获取的未来P小时的先验降雨数据、所述原始流量数据以及所述原始位置信息进行预处理,分别得到处理后降雨数据、处理后先验降雨数据、处理后流量数据以及处理后位置信息,包括:

对所述原始降雨数据进行数据剔除、数据补全处理以及归一化处理,得到处理后降雨数据;

将所述先验降雨数据进行归一化处理,得到处理后先验降雨数据;

将所述原始流量数据进行归一化处理,得到处理后流量数据;

将所述原始位置信息进行网格化处理,得到处理后位置信息。

可选的,所述对所述原始降雨数据进行数据剔除、数据补全处理以及归一化处理,得到处理后降雨数据,包括:

将所述原始降雨数据中,数据数目低于预设数量的水文站点所对应的数据剔除,得到剩余降雨数据;

对所述剩余降雨数据中缺失的降雨数据,利用反距离加权法进行数据补全,得到补全降雨数据;

将所述补全降雨数据进行归一化处理,得到处理后降雨数据。

可选的,所述归一化处理包括[0,1]归一化处理。

可选的,所述基于所述处理后降雨数据、所述处理后先验降雨数据以及所述处理后位置信息,形成网格化降雨数据,包括:

针对每一小时,从所述处理后降雨数据和所述处理后先验降雨数据中,选取该小时各水文站点对应的降雨数据分别填入所述处理后位置信息中各水文站点的对应位置处,形成该小时对应的第一网格化降雨数据,由所述处理后降雨数据和所述处理后先验降雨数据对应的所有所述第一网格化降雨数据构成所述网格化降雨数据。

可选的,所述第一分支网络对所述网格化降雨数据提取空间分布特征,并进行时序特征提取,得到第一输出特征的过程,包括:

将所述网格化降雨数据输入所述第一分支网络的所述降维网络得到降维数据;

将所述降维数据利用所述第一分支网络的所述特征变换网络进行特征展平,得到展平数据;

从所述展平数据中选取历史T小时和未来P小时对应的数据构成第一向量;其中,T为大于1的自然数,且T小于等于所述K年对应的小时数;

将所述第一向量利用所述第一分支网络的所述多个GRU层提取时序特征,得到第一输出特征;

其中,所述降维网络包括二维卷积层以及最大池化层。

可选的,所述第二分支网络对所述处理后流量数据进行时序特征提取,得到第二输出特征的过程,包括:

从所述处理后流量数据中选取T小时对应的数据构成第二向量;

将所述第二向量利用所述第二分支网络的所述多个GRU层提取时序特征,得到第二输出特征。

可选的,所述第三网络对所述第一输出特征以及所述第二输出特征进行合并分类预测,得到所述目标水文站点未来P小时的流量预测值的过程,包括:

将所述第一输出特征以及所述第二输出特征利用所述第三网络的所述concat模块进行特征合并,得到合并特征;

将所述合并特征利用所述第三网络的所述多个全连接层进行分类预测,得到所述目标水文站点未来P小时的流量预测值。

本发明实施例提供的一种基于深度学习的水流量预测模型,利用各水文站点的位置信息,将历史降雨数据和未来先验降雨数据进行网格化,从而引入降雨的空间分布信息,并将网格化降雨数据,利用预先训练的基于深度学习的水流量预测模型的分支网络之一提取空间分布特征和时序特征;将历史流量数据利用基于深度学习的水流量预测模型的分支网络之另一进行时序特征提取,通过对两分支网络的输出特征进行合并分类预测,可以得到未来一个时间段的水流量预测值。本发明实施例提出的预测模型可以一次性得到未来一个时间段的水流量预测结果,该结果考虑到降雨量的空间分布情况,因此能够充分挖掘实际降雨数据所描述的信息,得到与实际降雨情况相符的预测结果,预测的准确性较高。

当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。

以下将结合附图及实施例对本发明做进一步详细说明。

附图说明

图1是本发明实施例提供的一种基于深度学习的水流量预测模型的结构示意图;

图2是本发明实施例提供的基于深度学习的水流量预测模型的具体结构示意图;

图3是本发明实施例提供的第一分支网络的具体结构图;

图4是本发明实施例提供的第二分支网络的具体结构图;

图5是本发明实施例提供的第三网络的具体结构图;

图6是本发明实施例提供的自编码器训练结构示意图;

图7是本发明实施例的预测过程示意图;

图8是本发明实施例提供的输入数据的示例图;

图9是本发明实施例的水峰值预测效果对比图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为了实现未来一个时间段的水流量预测,并完全挖掘实际降雨数据所描述的信息,得到与实际降雨情况相符的准确性高的预测结果的目的,本发明实施例提供了一种基于深度学习的水流量预测方法、装置、电子设备及存储介质。

下面,首先对本发明实施例所提供的一种基于深度学习的水流量预测模型进行介绍。

参见图1,图1为本发明实施例提供的一种基于深度学习的水流量预测模型的结构示意图。

本发明实施例提供的一种基于深度学习的水流量预测模型,包括:

顺次连接的分支网络组和第三网络;分支网络组包括并联的第一分支网络和第二分支网络;第一分支网络基于卷积神经网络以及循环神经网络构建;第二分支网络基于循环神经网络构建;第三网络基于全连接层构建;

第一分支网络,用于对网格化降雨数据提取空间分布特征,并进行时序特征提取,得到第一输出特征;网格化降雨数据基于预定流域的N个水文站点的历史K年各小时和未来P小时降雨量数据和N个水文站点的位置信息确定;

第二分支网络,用于对处理后流量数据进行时序特征提取,得到第二输出特征;处理后流量数据基于N个水文站点中位于预定流域的出口断面处的目标水文站点的历史K年各小时水流量数据确定;

第三网络,用于对第一输出特征以及第二输出特征进行合并并分类预测,得到目标水文站点未来P小时的流量预测值,其中,N、K和P为大于1的自然数。

预定流域是一个地理区域,在该地理区域内包含N个水文站点,用于监测降雨情况,N个水文站点中有一个目标水文站点位于预定流域的出口断面,用于监测该预定流域出口断面的水位及流量的变化情况。

以下,首先对本发明实施例提供的基于深度学习的水流量预测模型进行简单介绍,关于网格化降雨数据以及处理后流量数据的构建过程将在后文中予以介绍。

本发明实施例为了实现未来一个时间段的水流量预测,利用卷积神经网络(CNN)技术以及循环神经网络(RNN)技术提出具体的基于深度学习的水流量预测模型。

其中,如下公式(4)所示。

Q

其中,f(X

卷积神经网络是一种专门用来处理网格化数据结构的神经网络,相比于传统的全连接网络结构,其具有参数少,感受野易调整等优点,在图像处理方面具有较大的优势。应用在水利中,结合生成的降雨空间分布二维数据,可以有效的提取降雨数据的空间分布信息。

循环神经网络是一种专门处理具有时序特征的神经网络,其内部特殊的隐含状态传递机制,可以使得当前的数据特征传递给下一时刻合并分析。从而让整个序列具有时间上的因果连续性。本发明使用RNN的变体结构GRU网络,相比于RNN,GRU添加了遗忘门,可以有效的防止时序过长导致的梯度爆炸问题。

本发明实施例基于python搭建基于深度学习的水流量预测模型,图2是本发明实施例的基于深度学习的水流量预测模型的具体结构示意图。该基于深度学习的水流量预测模型包括:串联的分支网络组和第三网络,分支网络组包括并联的第一分支网络和第二分支网络。

其中,第一分支网络包括:降维网络、特征变换网络以及多个GRU层。第二分支网络包括多个GRU层。第三网络包括:concat模块以及多个全连接层。

下面对基于深度学习的水流量预测模型的各个网络进行具体介绍。

(1)第一分支网络:

参考图3,图3是本发明实施例提供的第一分支网络的具体结构图。降维网络包括卷积层以及池化层构成的级联结构。本实施例中,将CNN结构用于降维网络。

本发明实施例中的卷积层可以为二维卷积层,用Conv2D表示,池化层用Pooling表示。具体各层的参数见表1。

表1基于深度学习的水流量预测模型的降维网络的层参数

本模型中Conv2D用于进行特征提取,Pooling用于降低参数数目,进行特征筛选。卷积模式均为VALID卷积模式,Pooling采用的池化模式均为MaxPooling。最终得到的输出向量的维度为[T,k1,k2],其中,k1、k2与卷积模块大小设置相关。

又因为,降维网络输出为三维数据,而GRU网络需要二维的输入数据。GRU第一个维度为时间步长,即T,与降维网络的输出一致,第二个维度为每个时间点的特征向量。本发明实施例中,采用reshape的方式进行维度的重新构建,增加特征变换网络,将降维网络输出维度的k1、k2合并成一个维度,作为对应时间点的特征向量,维度为[T,k1×k2],符合GRU网络的输入数据维度要求。

第一分支网络的包括GRU层1、GRU层2、GRU层3。

本实施例中,RNN计算模块采用GRU网络作为其结构核心,使用多层GRU的模型架构,具体结构如图4所示。

本实施例中,采用三层GRU层构建GRU网络。GRU网络每层的神经元个数依次为50、30、10,输出数据的维度为[T,10]。具体各层的参数见表2。

表2 GRU网络的层参数

(2)第二分支网络:

参考图4,图4是本发明实施例提供的第二分支网络的具体结构图。与第一分支网络的多个GRU层类似,也采用三层GRU层,具体参数与第一分支网络的多个GRU层相同,在此不再赘述。

(3)第三网络:

参考图5,图5是本发明实施例提供的第三网络的具体结构图。

concat是神经网络中特征融合的一种方式,是通道数的合并。

全连接层主要用于模型的数值拟合,来增加模型的拟合能力。采用多层全连接层级联结构,添加dropout和batchnormalize操作进行过拟合避免。三层全连接层神经元个数依次为100、50、P。dropout采用的丢弃比例均为0.1。模型的输出维度为[P,1],即为所求的未来P小时的流量。具体各层的参数见表3。

表3全连接层的层参数

基于深度学习的水流量预测模型是利用N个水文站点的历史数据中,在前的T个小时的降雨数据、流量数据,以及其后的P小时的降雨数据和流量数据迭代训练得到的。

比如,可以利用历史数据中2013至2017年的100小时的降雨数据和流量数据、针对待预测时间段为24小时的已知的降雨数据,构建样本输入数据(参考后文)。以针对待预测时间段为24小时的已知的流量数据作为真值,进行迭代训练,比如迭代达到100次,直至获得训练好的模型参数,即得到训练完成的基于深度学习的水流量预测模型。关于模型训练过程概述为如下步骤。

1)将样本输入数据中每一样本数据和对应的真值,通过如图2结构所示的初始的网络模型进行训练,获得各样本数据的训练结果。

2)将每一样本数据的训练结果与该样本数据对应的真值进行比较,得到该样本数据对应的预测结果。

3)根据各个样本数据对应的预测结果,计算网络模型的损失值。

4)根据损失值调整网络模型的参数,并重新进行1)-3)步骤,直至网络模型的损失值达到了一定的收敛条件,也就是损失值达到最小,这时,意味着每一样本数据的训练结果与该样本数据对应的真值一致,从而完成网络模型的训练,得到训练完成的基于深度学习的水流量预测模型。

具体的,训练过程采用Adam(Adaptive moment estimation)梯度下降的优化算法,以获得较好的损失下降过程。损失函数采用MSE(mean-square error,均方误差)。学习率为0.01。同时,添加了dropout操作,Dropout是一种在深度学习环境中应用的参数正则化手段。可以作为训练深度神经网络的一种trick供选择。在每个训练批次中,通过忽略一半的特征检测器(让一半的隐层节点值为0),可以明显地减少过拟合现象。

在训练完成后,可以将待预测的输入数据输入预先训练得到的基于深度学习的水流量预测模型进行预测。

以下介绍网格化降雨数据以及处理后流量数据的构建过程和模型的预测过程。在模型预测领域中,输入数据的构建过程可以理解为模型的样本构建过程,是模型预测过程必不可少的环节。

网格化降雨数据以及处理后流量数据的构建过程可以包括以下步骤:

步骤S1,获取预定流域的原始降雨数据、原始流量数据以及N个水文站点的原始位置信息。

其中,原始降雨数据包括预定流域的N个水文站点的历史K年各小时降雨数据。原始流量数据包括N个水文站点中位于预定流域的出口断面处的目标水文站点的历史K年各小时流量数据。原始位置信息包括N个水文站点的经度和N个水文站点的纬度,N和K为大于1的自然数。

在本发明实施例中,可以分别从N个水文站点处获取历史K年各小时降雨数据生成原始降雨数据,从目标水文站点处获取历史K年各小时流量数据生成原始流量数据。作为优选的实施方案,历史K年可以为历史数据中,距离当前时间最近的连续K年。

作为本发明实施例的具体示例,选择中国河南省的息县流域作为预定流域,息县流域共有50个水文站点,时间范围可以选择为2013年~2018年,即N=50,K=6。获得的原始降雨数据、原始流量数据以及原始位置信息的示例如表4~表6所示,因作为形式示例,具体数值、名称不进行示出。其中,TM为时间戳,以一小时为单位;S1~S50表示50个水文站点的降雨数据;Q表示目标水文站点的流量数据;A1~A50表示50个水文站点的编号;LTGD表示水文站点的经度坐标;LTTD表示水文站点的纬度坐标,S1~S50、Q均以毫米为单位。

表4原始降雨数据示例表

表5原始流量数据示例表

表6原始位置信息示例表

本领域技术人员可以理解的是,表1示例的原始降雨数据的维度为[(6×365×24),50]=[52560,50]。表2示例的原始流量数据的维度为[52560,1]。表3示例的原始位置信息的维度为[50,2]。

步骤S2,将原始降雨数据、预先获取的未来P小时的先验降雨数据、原始流量数据以及原始位置信息进行预处理,分别得到处理后降雨数据、处理后先验降雨数据、处理后流量数据以及处理后位置信息。

可选的一种实施方式中,步骤S2可以包括步骤S21~S24。

步骤S21,对原始降雨数据进行数据剔除、数据补全处理以及归一化处理,得到处理后降雨数据。

在实际中,由于疏漏等原因,水文站点的降雨数据可能存在缺失,可以理解的是,如果使用缺失数据过多的原始降雨数据进行计算,会影响后续预测的准确性,因此,在该步骤中,首先需要对缺失数据过多的水文站点的数据进行剔除。

具体的,步骤S21可以包括以下三个步骤:

步骤一,将原始降雨数据中,数据数目低于预设数量的水文站点所对应的数据剔除,得到剩余降雨数据;

比如针对表1的原始降雨数据,如果某一个水文站点的降雨数据的数目低于预设数量30000,则表明现存数据比例已经小于

关于预设数量可以根据原始降雨数据的维度以及数据精度的需要进行合理选择。

步骤二,对剩余降雨数据中缺失的降雨数据,利用反距离加权法进行数据补全,得到补全降雨数据。

本领域技术人员可以理解的是,在剩余降雨数据中仍会有一些时间点的降雨数据存在缺失,可以使用缺失值补全算法对缺失的降雨数据进行补全。

其中,反距离加权算法(Inverse Distance Weighted,IDW)是缺失值补全的经典算法。反距离加权算法按照距离越远,相关性越小的原则,使用临近水文站点的降雨数据来对某一水文站点的缺失降雨数据进行补全。反距离加权算法的公式如下公式(1)所示。

其中,q为出现数据缺失的水文站点的降雨数据估计值;M为参与计算的水文站点个数;q

利用上述反距离加权算法可以对剩余降雨数据中缺失降雨数据的水文站点的降雨数据补全,并得到完整的降雨总和数据,从而得到补全降雨数据。即表1中的数据得以完整填充。

步骤三,对补全降雨数据中所有水文站点的降雨数据进行归一化处理。

步骤S22,将原始流量数据进行归一化处理,得到处理后流量数据。

步骤S23,将先验降雨数据进行归一化处理,得到处理后先验降雨数据。

由于步骤S21~S23涉及的归一化处理方法相同,在此一并说明。归一化是一种无量纲处理手段,使物理系统数值的绝对值变成某种相对值关系。是简化计算,缩小量值的有效办法。通过合适的归一化处理,可以加快梯度下降求最优解的速度,降低模型参数数值大小,加快模型训练过程中的收敛速度,改善模型的性能,提高精度。

常用的归一化方法包括:min-max标准化、标准差标准化、非线性归一化等。由于降雨数据和流量数据并不满足正态分布,因此,本发明实施例优选的实施方案中,归一化处理包括[0,1]归一化处理。

[0,1]归一化处理属于min-max标准化,其通过对数据的每一个维度的值进行重新调节,使得最终的数据向量落在[0,1]之间。[0,1]归一化处理具体公式如下公式(2)所示。

其中,h

通过上述[0,1]归一化处理,可以得到补全降雨数据进行归一化处理后的处理后降雨数据,以及得到原始流量数据进行归一化处理后的处理后流量数据。

步骤S24,将原始位置信息进行网格化处理,得到处理后位置信息。

本实施例中,数据网格化根据各个站点的经纬度信息,按照0.01的分度值进行坐标生成,坐标计算公式如下公式(3)所示。

其中,lg

可以理解的是,处理后位置信息含有多个网格,每个网格表示一个水文站点的位置信息。

步骤S3,基于处理后降雨数据、处理后先验降雨数据以及处理后位置信息,形成网格化降雨数据。

针对每一小时,从处理后降雨数据和处理后先验降雨数据中,选取该小时各水文站点对应的降雨数据分别填入处理后位置信息中各水文站点的对应位置处,形成该小时对应的第一网格化降雨数据,由处理后降雨数据和处理后先验降雨数据对应的所有第一网格化降雨数据构成网格化降雨数据。

可以理解的是,经过步骤S24后,将N个水文站点表示在网格坐标上,本步骤中,从S2生成的处理后降雨数据以及处理验降雨数据,找取每一小时中,每一水文站点对应的降雨数据,填入该水文站点在处理后位置信息中的对应位置处,当该小时内所有水文站点均对应填充后可以得到该小时对应的第一网格化降雨数据,针对历史K年每一小时以及未来P小时均按照同样操作处理完毕。可以理解的是,针对每一小时可以得到一个对应的第一网格化降雨数据,由最终得到的所有第一网格化降雨数据构成网格化降雨数据。

本领域技术人员可以理解的是,网格化降雨数据的表格维度为[52560,x,y],其中,x、y分别表示网格化降雨数据的矩阵跨度。

以下,结合网格化降雨数据以及处理后流量数据,对本发明实施例提供的基于深度学习的水流量预测模型得到的目标水文站点未来P小时的流量预测值的过程进行介绍,该过程包括:

(1)第一分支网络对网格化降雨数据提取空间分布特征,并进行时序特征提取,得到第一输出特征。

可选的一种实施方式中,该过程包括:

步骤1,将网格化降雨数据输入第一分支网络的降维网络得到降维数据;

基于深度学习的水流量预测模型的第一分支网络是利用自编码器(autoencoder,AE)的方案来进行原始网格数据的降维处理,自编码器对输入信息进行学习,是对输入特征的一个表征学习。可以在降低网格化数据维度的同时,最大程度的保留原始数据的特征。具体结构如图6所示,图6是本发明实施例提供的自编码器训练结构示意图。encoder为编码器,decoder为解码器,AE在训练的过程中,训练目标为decoder的输出和encoder的输入之间差距尽可能的小。在模型训练好之后,我们去掉其decoder模块。使用encoder模块的输出作为降维的结果。

另外,除了上述降维方法,还可以采用传统机器学习的PCA降维以及网络嵌入等手段进行降维。

可以理解的是,降维除了能够减小计算量,还可以有效的去掉数据中的一些噪声,提高模型的训练速度和预测精度。

步骤2,将降维数据利用第一分支网络的特征变换网络进行特征展平,得到展平数据;

步骤3,从展平数据中选取历史T小时和未来P小时对应的数据构成第一向量,其中,T为大于1的自然数,且T小于等于K年对应的小时数;

步骤4,将第一向量利用第一分支网络的多个GRU层提取时序特征,得到第一输出特征。

(2)第二分支网络对处理后流量数据进行时序特征提取,得到第二输出特征。

可选的一种实施方式中,该过程包括:

步骤1,从处理后流量数据中选取T小时对应的数据构成第二向量;

步骤2,将第二向量利用第二分支网络的多个GRU层提取时序特征,得到第二输出特征。

(3)第三网络对第一输出特征以及第二输出特征进行合并分类预测,得到目标水文站点未来P小时的流量预测值。

可选的一种实施方式中,该过程包括:

步骤1,将第一输出特征以及第二输出特征利用第三网络的concat模块进行特征合并,得到合并特征;

将合并特征利用第三网络的多个全连接层进行分类预测,得到目标水文站点未来P小时的流量预测值。

具体预测过程可以参见图7,图7是本发明实施例的预测过程示意图。以T=100,P=24为例说明。

优选的,历史T小时与未来P小时为连续时间时,得到的流量预测值更为精确。

为了便于理解输入数据的形式,请参见图8,图8是本发明实施例的输入数据的示例图。该图仅作为形式示例,具体数据不进行示出。其中0表示当前时刻。需要说明的是,图8中的文字说明进行了简化示意。

由于站点覆盖区域范围较大,按照0.01的刻度来进行生成网格,将导致得到的网格规模过大,给硬件数据存储和模型训练计算都带来了较大的负担。如果采用更大的刻度来进行网格化生成,在矩阵规模减小的同时,却损失了大量的空间分布信息,与本实施例中采用CNN网络的目的相悖。因此,本发明实施例中第一分支网络的降维网络即为上述自编码器,用于对网格化降雨数据进行降维。

本实施例中,以息县流域的50个水文站点为例,得到了一个维度为[150,150]的处理后位置信息。

基于处理后降雨数据与处理后位置信息,形成的网格化降雨数据的维度为[K×365×24+P,150,150]=[8760K+P,150,150],其中[8760K+P,150,150]表示的是网格化降雨数据维度,经过降维网络的二维卷积层以及最大池化层,得到的降维数据维度为[8760K+P,30,30]。

为了与GRU网络的输入向量维度相匹配,需要对降维数据的维度进行重新构建。因此,对降维数据进行特征展平,得到的展平数据的维度为[8760K+P,30×30]=[8760K+P,900]。

选取了历史100小时以及未来24小时的降雨数据,得到的第一向量的维度为[124,900]。

第一向量经过GRU层1后,维度从[124,900]变为[124,30];经过GRU层2后,维度从[124,30]变为[124,20];经过GRU层2后,维度从[124,20]变为[124,10]。

最后,第一向量经由第一分支网络的三层GRU层进行时序特征提取,得到第一输出特征,维度从[124,10]变为[10]。

对于处理后的流量数据,选取历史100小时的处理后流量数据构成第二向量,第二向量的维度为[100,1]。

第二向量经过GRU层1后,维度从[100,1]变为[100,30];经过GRU层2后,维度从[100,30]变为[100,20];经过GRU层2后,维度从[100,20]变为[100,10]。

最后,第二向量经由第二分支网络的三层GRU层进行时序特征提取,针对[124,10]的向量利用注意力机制为124小时数据中每个小时的数据附加一个权重,并进行加权求和,得到维度为[10]的第二输出特征。

将第一输出特征和第二输出特征利用第三网络的concat模块进行向量合并,得到的合并特征维度为[20]。

本实施例中,预测的是未来24小时的流量预测值。

三个全连接层的神经元数量分别为100、50和24。将合并特征利用三层全连接层进行分类预测,实现网络的数值拟合。

合并特征经过全连接层1后,维度从[20]变为[50];经过全连接层2后,维度从[50]变为[40];经过全连接层3后,维度从[40]变为[24]。

最后,得到维度为[24]的目标水文站点未来P小时的流量预测值。

其中,concat是神经网络中特征融合的一种方式,是通道数的合并。在图8中标记有各层处理的数据维度,以便于理解数据变化。关于GRU层和全连接层的具体处理过程请参见现有技术理解,在此不再赘述。

具体预测结果请参见图9,图9是本发明实施例的水峰值预测效果对比图。其中,上图为2018年实际流量图,下图为2018年预测流量图,flow为水峰值,单位为毫米。time为时间,单位h表示小时。可以看到,上下两图相似度极高,表明应用本发明实施例的基于深度学习的水流量预测模型可以达到较高的预测准确性。

因此,利用本发明实施例的基于深度学习的水流量预测方法可以实现未来一个时间段的水流量的准确预测。

可以理解的是,通过本发明实施例的基于深度学习的水流量预测模型得到的流量预测值也是归一化的数据,之后,可选的,可以利用相应的数据处理,得到与真实测量得到的流量值同一数据规格的数值。对此不再赘述。

可选的实施方式中,基于深度学习的水流量预测模型可以将得到的目标水文站点未来P小时的流量预测值进行输出,例如发送至另一设备或者进行显示,如显示在预定电子设备的显示屏上等等。

可选的实施方式中,基于深度学习的水流量预测模型还可以将得到的目标水文站点未来P小时的流量预测值与预定阈值进行比较,当目标水文站点未来P小时的流量预测值大于预定阈值时,发出警示信息。

本发明实施例所提供的方案中,利用各水文站点的位置信息,将历史降雨数据和未来先验降雨数据进行网格化,从而引入降雨的空间分布信息,并将网格化降雨数据,利用预先训练的基于深度学习的水流量预测模型的分支网络之一提取空间分布特征和时序特征;将历史流量数据利用基于深度学习的水流量预测模型的分支网络之另一进行时序特征提取,通过对两分支网络的输出特征进行合并分类预测,可以得到未来一个时间段的水流量预测值。本发明实施例提出的预测模型可以一次性得到未来一个时间段的水流量预测结果,该结果考虑到降雨量的空间分布情况,因此能够充分挖掘实际降雨数据所描述的信息,得到与实际降雨情况相符的预测结果,预测的准确性较高。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号