法律状态公告日
法律状态信息
法律状态
2022-08-16
实质审查的生效 IPC(主分类):G06F30/27 专利申请号:2022102273120 申请日:20220308
实质审查的生效
技术领域
本发明涉及人工智能技术领域,具体涉及一种基于改进联邦学习的径流预测方法。
背景技术
准确的径流预测,对于流域水资源调度和合理配置、防汛抗旱工作的开展,指导水资源的合理开发利用,减少极端天气灾害带来的人员伤亡和经济损失,具有非常重要的实际意义。
径流预测方法总体上可以分为两类:基于物理过程的水文模型和基于数据驱动的模型。物理过程模型通过考虑径流的复杂形成过程来实现预测,但此类模型通常需要大量水文、气象、地形等各类数据,以及复杂的数学工具和用户专业知识。数据驱动模型主要根据水文现象的统计规律,通过考虑一个水文现象的统计关系来预测未来的水文过程。而其中的基于神经网络的预测方法,可模拟输入输出之间复杂的非线性关系,无需考虑具体的水文物理过程,具有强大的学习拟合能力,作为径流预测方法的有益补充得到了广泛的关注与研究。
虽然基于神经网络的方法可以降低建模的难度,但是仍存在着不可忽视的问题,包括:
第一,大量涉水信息系统基于本业务或者本部门的需求,存在应用系统、数据存储方式、数据格式上的差异,导致信息与资源分散,异构性严重,并且受工作体制、管理体制及安全性和保密性多方面影响,各个水文部门的水雨情信息无法及时共享,形成信息孤岛,这对于训练实现集中式的径流预测神经网络模型带来了一定程度上的阻碍。
第二,目前大部分的研究主要都集中于单站点的时间序列数据预测,或者某一个特定的流域,而神经网络是通过从大量数据集中挖掘复杂特征来提高模型泛化能力,因此目前研究工作形式具有局限性,训练出来的径流预测模型很难移植到其他流域,在利用数据丰富地区的水文信息对少资料或者无资料地区的水文水资源分析提供帮助方面还存在着困难。
发明内容
发明目的:为解决水文大数据中水文信息孤岛问题,以及为少资料或无资料地区生成径流预测模型提供解决思路,本发明提出了一种基于改进联邦学习的径流预测方法及预测系统,利用联邦学习的方法训练的模型初始参数学习器学习来自多个流域的水文数据特征,应用到特定流域时使用少量样本即可快速得到局部模型,更容易移植到少资料或无资料地区,同时解决了使用传统联邦学习方法存在的模型异构性问题,进一步提高模型性能。
技术方案:一种基于改进联邦学习的径流预测方法,包括以下步骤:
步骤1:参数服务器将模型初始参数学习器
步骤2:在每个接收到模型初始参数学习器
将模型初始参数学习器
基于初始模型参数w
基于优化后的初始模型参数
步骤3:参数服务器聚合所有参与本轮联邦训练的K个本地计算节点的梯度,得到梯度集合{g
步骤4:判断模型是否收敛或者迭代次数是否达到指定通信轮次,若满足某一条件,则执行步骤5,否则继续执行步骤1至步骤4;
步骤5:将模型初始参数学习器
步骤6:对于每个本地计算节点,基于值
将值
基于该模型参数,对本地径流进行预测,得到预测结果。
进一步的,所述的支撑集
选取降雨、短波向下辐射、日最高温度、日最低温度、大气压强作为数据特征,以流域的日径流量作为标签;
对数据特征及标签转换为无量纲的纯数值;
基于时间步长T,将转换后的数值转换为适应监督学习问题形式的数据,以此构建得到数据集;
将数据集划分为训练集和测试集,以及将训练集细分为支撑集
进一步的,步骤2中,所述的基于初始模型参数w
其中,
进一步的,步骤2中,所述的基于优化后的初始模型参数
得到更新的
其中,
进一步的,步骤3中,所述的基于梯度集合{g
其中,β表示模型初始参数学习器
本发明还公开了一种基于改进联邦学习的径流预测系统,包括:
n个本地计算节点,分别部署在对应的流域内,内置本地径流预测模型,用于执行以下联邦学习步骤和本地径流预测模型调整步骤;
其中,联邦学习步骤包括:
将参数服务器下发的模型初始参数学习器
基于初始模型参数w
基于优化后的初始模型参数
将梯度g
其中,本地径流预测模型调整步骤包括:
将参数服务器下发的值
采用本地计算节点上的支撑集
基于该模型参数,对本地径流进行预测;
参数服务器,内置模型初始参数学习器
将模型初始参数学习器
对参与本轮联邦训练的K个本地计算节点的梯度进行聚合,得到梯度集合{g
基于梯度集合{g
判断联邦学习步骤中模型是否收敛或者迭代次数是否达到指定通信轮次,若满足某一条件,则将模型初始参数学习器
进一步的,所述的基于初始模型参数w
其中,
进一步的,所述的基于优化后的初始模型参数
得到更新的
其中,
进一步的,所述的基于梯度集合{g
其中,β表示模型初始参数学习器
有益效果:本发明与现有技术相比,具有以下优点:
(1)本发明利用联邦学习方法联合多个流域数据进行训练径流预测模型,在训练过程中只共享模型参数无需共享数据,有效解决了水文大数据中水文信息孤岛问题;
(2)本发明针对传统联邦学习方法有较大改进,主要体现在:第一,通过共享一个参数化模型初始参数学习器,而不是一个全局模型,改进传统方法中全局模型精度较低的问题;第二,在特定流域基于全局训练得到的模型初始参数学习器利用少量样本进行快速适应,生成特定流域的局部径流预测模型,从而更容易移植到少资料或无资料地区。
附图说明
图1为本发明的原理示意图;
图2为本发明的过程示意图。
具体实施方式
本发明的一种基于改进联邦学习的径流预测方法,通过对传统联邦学习的训练过程进行改进,利用部署在多个流域内具有计算和数据存储能力的计算节点,使得多个流域对应的计算节点联合训练一个全局模型初始参数学习器,即联合多个流域的数据一起训练,且在训练过程中只共享模型参数而无需共享数据,这在一定程度上可以解决水文信息孤岛问题;本发明初期训练的学习器为全局模型初始参数学习器,并非直接应用到本地的全局模型;联合训练之后该学习器掌握了其他流域的共有的基础特征表示,从而可以在特定流域上快速适应,即当该学习器应用到特定流域时,再使用少部分样本即可快速训练出较优的局部径流预测模型,即得到适用于特定流域的局部径流预测模型,这在一定程度上克服了传统联邦学习方法的模型异构性问题,提高模型预测精度,并且为少资料无资料地区提供了水文水资源分析的手段。
现结合附图1和图2进一步阐述本发明的技术方案。假设要对n个流域联合训练径流预测模型,则本发明主要涉及一个参数服务器PS、n个流域对应的n个本地计算节点。本地径流预测模型f(w
步骤1:本步骤主要是为每个计算节点准备径流数据集,具体过程为:
S110:假设参与训练的n个流域对应的本地计算节点记为B
为了防止由于不同属性值的量级差异降低训练效率,对数据特征及标签执行Z-Score规范化操作,去除数据的单位限制,转换为无量纲的纯数值,具体计算公式为:x=(x-mean)/std,其中mean表示数据x的均值,std表示数据x的标准差。
S120:对数据执行规范化后,确定时间步长T,基于时间步长T将S110得到的数据集转换为适应监督学习问题形式的数据,转换后形状为(samples,T,5),对应标签形状为(samples,1),其中时间步长T表示基于前T天的气象和径流数据预测当前时间的日径流量Q;
S130:将S120得到的数据集按照8:2的比例划分为用于联邦训练阶段的训练集和用于模型调整阶段的测试集,并按照比例p,其中p∈(0,1),将训练集细分为支撑集
步骤2:参数服务器PS对模型初始参数学习器
步骤3:随机选取K个本地计算节点,其中K=rn,r∈(0,1),并将模型初始参数学习器的值
步骤4:本步骤目的为模型初始参数学习器
S410:本轮参与联邦训练的本地计算节点B
S420:本地计算节点B
其中,
其中
步骤5:本步骤的目的为利用查询集评估模型初始参数学习器
S510:得到更新的
其中,
S520:本地计算节点B
参与本轮联邦训练的本地计算节点均处于并行训练状态,以提高训练速度。
步骤6:本步骤的目的为参数服务器PS基于本地计算节点上传的梯度优化模型初始参数学习器,具体过程为:
S610:参数服务器PS基于同步训练的方式,聚合所有参与本轮联邦训练的K个本地计算节点上传的梯度,以捕获不同计算节点对应的不同流域之间径流流量、气象特征的内在联系,得到梯度集合{g
S620:参数服务器PS,基于接收到的梯度集合{g
其中,β表示学习率,不同于本地模型训练时的学习率α,K表示参与本轮联邦训练的流域个数。
步骤7:若模型收敛或者联邦训练的次数达到指定通信轮次,则结束训练,训练结束之后每个本地计算节点将会得到一个相同的模型初始参数学习器
上述步骤3~7为联邦训练阶段。
步骤8:联邦训练完成后,开始执行模型调整阶段,具体过程如下:
每一个本地计算节点B
其中,
综上所述,本发明通过联邦学习的方法将包含径流和气象数据的多个流域一起联合训练,从而可以捕获到多个流域的水文信息特征,并通过改进传统联邦学习的学习过程,一定程度上解决了水文信息孤岛问题,提高了预测精度,并且为少资料或者无资料地区实现水文水资源信息分析提供了参考。
机译: 一种基于离岸平台海洋信息的位置信息预测和位置信息学习预测系泊缆张力的系统
机译: 基于联邦学习的隔离林模型建设与预测方法和装置
机译: 用于学习驱动主轴的主轴或电动机的故障预测的机器学习装置和机器学习方法,以及包括机器学习装置的故障预测装置和故障预测系统