技术领域
本申请涉及信号工程技术领域,特别是涉及一种基于卷积网络和注意力机制的短时临近降雨预测方法。
背景技术
短时临近降雨预测是大气科学的一个重要领域。该任务的目标是在未来相对短的时间段(例如0-2小时)内,对当地区域的降雨情况进行及时且准确的预测。目前,该技术已经被广泛应用于为居民出行、农业生产、飞行安全等方面提供防洪防汛信息,它不仅能够方便人们,而且有利于防灾减灾,这也一直是天气预测领域的关键任务。随着气候的变化和城市化进程的加快,大气情况变得越来越复杂,各种气象现象频繁发生。气候变化给人们的生活和工作带来了许多不利影响,并且增加了许多不确定性的危险,如果能够对上述气象现象做出有效的预测和预防,损失将会大大减少。
而目前的短时临近降雨预测的常规方法主要包括:基于雷达回波外推方法,特别是其中的交叉相关法和基于光流的方法等,能有效地外推出未来雷达回波图(雷达回波图是定高度平面位置指示器图像),通过马歇尔-帕尔默关系或Z-R关系转换为降雨图,在转换的过程中会引入不必要的系统误差,导致短时临近降雨的预测精度低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高短时临近降雨的预测精度的基于卷积网络和注意力机制的短时临近降雨预测方法。
一种基于卷积网络和注意力机制的短时临近降雨预测方法,所述方法包括:
获取被预测区域在当前时间点前预设时段内的降雨过程图像;
将所述降雨过程图像进行预处理,获得完全时空特性的张量;
完全时空特性的张量输入多尺度特征融合的神经网络中进行特征提取,获得局部短期运动特征;
将所述局部短期运动特征输入到结合了注意力机制的卷积长短期记忆人工神经网络中进行降雨预测,获得降雨预测信息;
将所述预测结果信息输入到卷积层进行反向重构,获得所述被预测区域的未来降雨图像序列。
在其中一个实施例中,所述将所述局部短期运动特征输入到结合了注意力机制的卷积长短期记忆人工神经网络中进行降雨预测,获得降雨预测信息的步骤,包括:
将所述局部短期运动特征输入结合了注意力机制的第一卷积长短期记忆人工神经网络中,学习全局长期的时空特征依赖关系,获得时间运动特征,并将所述时间运动特征压缩成隐状态张量输出;
将所述隐状态张量输入到结合了注意力机制的第二卷积长短期记忆人工神经网络中进行预测,获得预测结果信息。
在其中一个实施例中,所述第一卷积长短期记忆人工神经网络和所述第二卷积长短期记忆人工神经网络的激活函数为ReLU非线性激活函数。
在其中一个实施例中,所述第一卷积长短期记忆人工神经网络由3个卷积长短期记忆人工神经网络单元组成;第二卷积长短期记忆人工神经网络由3个卷积长短期记忆人工神经网络单元组成。
在其中一个实施例中,在所述各所述卷积长短期记忆人工神经网络单元之前,还引入了Batch Normalization方法;
通过Batch Normalization方法对输入到各所述卷积长短期记忆人工神经网络单元的数据进行批标准化后,输入到各所述卷积长短期记忆人工神经网络单元。
上述基于卷积网络和注意力机制的短时临近降雨预测方法,通过获取在被预测区域当前时间点前预设时段内的降雨过程图像;将降雨过程图像进行预处理,获得完全时空特性的张量,完全时空特性的张量包含了大气变化中的时间和空间维度,更适合时空相关性强的短时临近降雨预测任务;完全时空特性的张量输入多尺度特征融合的神经网络中进行特征提取,获得局部短期运动特征,避免了直接利用卷积长短期记忆人工神经网络中进行学习而引起的空间特征混乱,将局部短期运动特征输入到结合了注意力机制的卷积长短期记忆人工神经网络中进行降雨预测,获得降雨预测信息,将所述预测结果信息输入到卷积层进行反向重构,获得被预测区域的未来降雨图像序列,改善了预测降雨图像模糊的情况,解决了时空信息丢失容易,预测精度低的问题,提高了短时临近降雨的预测精度。
附图说明
图1为一个实施例中基于卷积网络和注意力机制的短时临近降雨预测方法的流程示意图;
图2为一个实施例中单帧降雨过程图像的预处理流程示意图;
图3为一个实施例中卷积长短期记忆人工神经网络结构图;
图4为另一个实施例中基于卷积网络和注意力机制的短时临近降雨预测方法的流程示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种基于卷积网络和注意力机制的短时临近降雨预测方法,包括以下步骤:
步骤S220,获取被预测区域在当前时间点前预设时段内的降雨过程图像。
其中,被预测区域指的是需要进行短时临近降雨预测的区域,被预测区域可以是一个地区,也可以是一个市,还可以是自定义的一个需要进行短时临近降雨预测区域等等。该降雨过程图像包括被预测区域在当前时间点前预设时段内的所有的降雨过程图像,降雨过程图像是根据历史降雨数据绘制而成的图像。
例如:在当前时间点为2020年10月15日11点30分,当前时间点前预设时段为1小时,被预测区域为A市,则从气象平台获取A市2020年10月15日10点30分-2020年10月15日11点30分的历史降雨数据,以10分钟为一次统计间隔,统计A市各个地方在2020年10月15日10点30分-2020年10月15日10点40分的降雨量,获得第一张降雨过程图像,统计A市各个地方在2020年10月15日10点40分-2020年10月15日10点50分的降雨量,获得第二张降雨过程图像,统计A市各个地方在2020年10月15日10点50分-2020年10月15日11点00分的降雨量,获得第三张降雨过程图像,统计A市各个地方在2020年10月15日11点00分-2020年10月15日11点10分的降雨量,获得第四张降雨过程图像,统计A市各个地方在2020年10月15日11点10分-2020年10月15日11点20分的降雨量,获得第五张降雨过程图像,统计A市各个地方在2020年10月15日11点20分-2020年10月15日11点30分的降雨量,获得第六张降雨过程图像,这六张降雨过程图像即为A市在2020年10月15日11点30分前1小时内的所有的降雨过程图像。
步骤S240,将降雨过程图像进行预处理,获得完全时空特性的张量。
其中,预处理主要是将降雨过程图像转换为完全时空特性的张量,即三维张量X∈R
步骤S260,完全时空特性的张量输入多尺度特征融合的神经网络中进行特征提取,获得局部短期运动特征。
其中,多尺度特征融合的神经网络是多尺度卷积神经网络(即:Multi-scaleCNN)。
步骤S280,将局部短期运动特征输入到结合了注意力机制的卷积长短期记忆人工神经网络中进行降雨预测,获得降雨预测信息。
其中,卷积长短期记忆人工神经网络(ConvLSTM)是LSTM(全称:Long Short-TermMemory,是一种时间循环神经网络)的变体,改变主要是W的权值计算变成了卷积运算,可以提取出图像的特征。
在一个实施例中,将局部短期运动特征输入到结合了注意力机制的卷积长短期记忆人工神经网络中进行降雨预测,获得降雨预测信息的步骤,包括:
将局部短期运动特征输入结合了注意力机制的第一卷积长短期记忆人工神经网络中,学习全局长期的时空特征依赖关系,获得时间运动特征,并将时间运动特征压缩成隐状态张量输出;将隐状态张量输入到结合了注意力机制的第二卷积长短期记忆人工神经网络中进行预测,获得预测结果信息。
其中,第一卷积长短期记忆人工神经网络和第二卷积长短期记忆人工神经网络的激活函数为ReLU非线性激活函数。第一卷积长短期记忆人工神经网络由3个卷积长短期记忆人工神经网络单元组成;第二卷积长短期记忆人工神经网络由3个卷积长短期记忆人工神经网络单元组成。
在一个实施例中,在各卷积长短期记忆人工神经网络单元之前,还引入了BatchNormalization方法;通过Batch Normalization方法对输入到各卷积长短期记忆人工神经网络单元的数据进行批标准化后,输入到各卷积长短期记忆人工神经网络单元。
其中,Batch Normalization方法是进行批标准化的方法,用于重新调整数据分布。
如图3所示的卷积长短期记忆人工神经网络结构图,该结构本质上还是LSTM,可是状态间的转换从乘法运算转换成了卷积运算,这样不仅可以像LSTM一样建立时序关系,而且可以像卷积神经网络(CNN)一样刻画空间特征,有效克服了时序传递过程中空间信息丢失的问题。正向传递与反向传递两个单向传递的卷积LSTM层组合连接后构成卷积长短期记忆人工神经网络,该卷积长短期记忆人工神经网络结合前后长期信息综合输出结果,解决了单向传递无法处理从后到前特征信息的问题。
其中,卷积长短期记忆人工神经网络的每一个卷积长短期记忆人工神经网络单元包含了来自卷积神经网络(CNN)时间和空间的输出,结构中计算过程如下:
其中,t是指当前时刻,X
f
步骤S300,将预测结果信息输入到卷积层进行反向重构,获得被预测区域的未来降雨图像序列。
其中,卷积层根据=预测结果信息反向重构生成被预测区域的未来降雨图像序列。
上述基于卷积网络和注意力机制的短时临近降雨预测方法,通过获取在被预测区域当前时间点前预设时段内的降雨过程图像;将降雨过程图像进行预处理,获得完全时空特性的张量,完全时空特性的张量包含了大气变化中的时间和空间维度,更适合时空相关性强的短时临近降雨预测任务;完全时空特性的张量输入多尺度特征融合的神经网络中进行特征提取,获得局部短期运动特征,避免了直接利用卷积长短期记忆人工神经网络中进行学习而引起的空间特征混乱,将局部短期运动特征输入到结合了注意力机制的卷积长短期记忆人工神经网络中进行降雨预测,获得降雨预测信息,将所述预测结果信息输入到卷积层进行反向重构,获得被预测区域的未来降雨图像序列,改善了预测降雨图像模糊的情况,解决了时空信息丢失容易,预测精度低的问题,提高了短时临近降雨的预测精度。
请参阅图4,提供了一种基于卷积网络和注意力机制的短时临近降雨预测方法,具体步骤如下:
首先,将被预测区域在当前时间点前预设时段内的降雨过程图像构建为具有统一时间维度和空间维度的完全时空特性的张量,形成连续降雨过程图像序列,其次,通过连续降雨过程图像序列输入多尺度特征融合的神经网络中进行特征提取,获取局部短期运动特征,再经过第一卷积长短期记忆人工神经网络(即三层加入注意力机制的长短期记忆人工神经单元(ConvLSTM))学习全局长期的时空特征依赖关系,将捕捉学习到的时间运动特征压缩成隐状态张量,输入到连接的第二卷积长短期记忆人工神经网络(即三层加入注意力机制的长短期记忆人工神经单元(ConvLSTM))进行未来降雨预测,获得未来降雨的预测结果信息,将未来降雨的预测结果信息输入到最后1层用于融合多帧时空状态的卷积层进行反向重构,生成未来的降雨图像序列。其中,基于卷积网络和注意力机制的短时临近降雨预测方法中,利用ReLU非线性激活函数代替传统Sigmoid技巧,还引入了BatchNormalization(BN)方法,提高网络收敛速度、缓解过拟合现象,能显著增强模型的学习能力,使其拥有更强的多帧降雨图的时空特征表达能力,有效提高预测准确性。
上述基于卷积网络和注意力机制的短时临近降雨预测方法,降雨过程图像输入数据维度需要先被重构,分别构建数据的时间维度和空间维度,在时空特征提取和运动信息学习的过程中,输入、输出都是三维张量,状态与状态之间转换也都是三维张量卷积运算,使得数据间具有统一的维度,同时保留了所有时间与空间特性,对该被预测区域降雨过程的预报更加全面、精确。
在一个实施例中,构建公式(6)中所示降雨过程图像的像素级均方误差(MSE)作为模型(该模型是由多尺度特征融合的神经网络、结合了注意力机制的卷积长短期记忆人工神经网络和卷积层组成的编码预测模型)的损失函数,用来衡量预测结果和实际结果间的相似度。式中y代表真实输出,y~代表预测输出,N为当前输出帧的总数,n表示当前第n个输出帧(一帧即为一张降雨过程图像),此时W、H分别代表降雨过程图像的横纵坐标。
该方法将前时刻的样本作为输入,后时刻的样本作为真实的输出,若当前时刻为t,当输入的10帧数据为{X
应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
机译: 基于卷积网络的船舶交通密度预测方法及装置
机译: 基于AI的雷达降雨预测方法和装置
机译: 基于深度学习的城市洪水降雨预测方法