法律状态公告日
法律状态信息
法律状态
2022-09-16
实质审查的生效 IPC(主分类):G06Q10/04 专利申请号:2022105558146 申请日:20220520
实质审查的生效
技术领域
本发明涉及水温预测技术领域,具体的说是基于LSTM与差分回归模型动态加权的海湾水温组合预测方法。
背景技术
水温是水产养殖中影响鱼类生长状况、生长质量的关键因素之一,水温的突变会对水体中pH值、溶解氧、氨氮等产生影响,影响鱼类适宜的生存环境。
水温易受气温、水生物活动等多因素交叉影响,具有非平稳、非线性等特征,使得单项预测方法存在预测精度低、泛化性能差等缺陷,难以满足人们对渔业生产管理的实际需要。
现有的水温预测方法主要包括传统数理统计法和人工智能方法,基于水温机理的数理方法对影响水温变化的机理和因素进行了分析,研究了不同水层条件、时空分布、流速、流量等对水温的影响,利用水文气象理论、二维和三维模型等构建水温预测模型,这些方法虽然能够对水库、水槽的水温进行有效预测,但预测模型复杂,参数多且难获取;基于数据挖掘的非机理方法一般通过大量数据构建数学模型,获得水温与相关影响因子的关系,捕捉水温变化规律,针对大量样本构建的数学模型较多使用机器学习算法,但单一的机器学习算法往往只能预测水温变化趋势,无法对水温突变点进行有效预测。目前仍缺少能有效预测水温变化趋势和水温突变点的水温预测方法。
发明内容
本发明的目的在于提出了基于LSTM与差分回归模型动态加权的海湾水温组合预测方法,该海湾水温预测方法精度高、结果可靠,能较好地预测海湾未来7天的水温数值,可为海洋渔业生产、科研和管理提供数据、信息和服务保障。
为实现上述目的,本发明采用以下技术方案:
基于LSTM与差分回归模型动态加权的海湾水温组合预测方法,包括以下步骤:
S1、收集海湾的水温数据和气象数据,并进行数据预处理;
S2、根据预处理后的数据,构建LSTM神经网络预测模型,以及对每日预报气温数据、水温数据进行差分,得到预报气温差分值和实测水温差分值;
S3、训练、测试LSTM神经网络预测模型,选取最佳的LSTM神经网络预测模型;
S4、基于预报气温差分值、实测水温值构建纯差分回归预测模型;基于预报气温差分值、实测水温差分值和实测水温值构建混差分回归预测模型;
S5、将最佳的LSTM神经网络预测模型、纯差分回归预测模型与混差分回归预测模型基于动态加权的方式组合成水温在线预测模型,并采用水温在线预测模型对海湾的水温进行预测。
优选地,步骤S1中所述水温数据包括日最高水温、日最低水温和日平均水温;所述气象数据包括气象观测数据和气象预报数据;所述气象观测数据包括气温统计量、气压统计量、相对湿度统计量、风速统计量、风向统计量和降水,时间分辨率为1天;所述气象预报数据包括每天更新的未来7日气象预报数据,未来7日气象预报数据包括未来7日的日最高温和日最低温。
优选地,步骤S2的具体过程为:
S21、对水温数据进行归一化处理,并将水温数据和气象观测数据按0.8:0.2的比例划分为训练集和测试集;
S22、基于水温数据的训练集部分,将气象观测数据和过去若干天的水温数据进行组合得到组合数据,再将组合数据作为输入因子,未来7天的水温数据作为输出因子,构建得到LSTM神经网络预测模型;
S23、对水温数据进行一阶差分;
S24、对每日获取的第一天气温数据进行一阶差分,并对每日获取的未来7日气温数据间进行一阶差分。
优选地,步骤S21中归一化处理的计算公式为:
其中,X是原始实测数据,X
优选地,步骤S3的具体过程为:
S31、基于水温数据的测试集部分,将组合数据输入到训练好的网络中,通过反归一化,得到未来7天的日频水温预测结果;
S32、对比预测结果和实测数据,以水温预警等级准确率、均方根误差RMSE、平均绝对误差MAE和决定系数R
优选地,步骤S31中反归一化公式为:
X
其中,X
步骤S32中所述水温预警等级准确率的计算公式为:
其中,水温等级的划分参照大黄鱼的适宜生长温度,共有7个等级;
以均方根误差RMSE为最重要的指标,对所有训练好的模型进行测试,选取在验证集和测试集中精度最高的模型为最佳的LSTM神经网络预测模型。
优选地,步骤S4中纯差分回归预测模型的构建方法为:
设第k天发布的气象预报的气温预测值分别为
第n(2≤n≤7)天水温预测值
其中,w
通过线性回归方程的方式选取w
设第k天发布的气象预报的气温预测值分别为
其中,x
优选地,步骤S4中混差分回归预测模型的构建方法为:
设第k天发布的气象预报的气温预测值分别为
第n(2≤n≤7)天水温预测值
其中,w
通过线性回归方程的方式选取w
设第k天发布的气象预报的气温预测值分别为
其中,x
优选地,步骤S5中所述动态加权的方式为:设置最佳的LSTM神经网络预测模型、纯差分回归预测模型与混差分回归预测模型的初始权重之比为1:1:1,以均方根误差RMSE为统计指标,每日对三个模型的预测精度进行统计,精度越大的令其权重更大,每日动态地更新组合模型的权重。
优选地,步骤S1中所述数据预处理包括剔除异常数据、剔除重复数据、对小段缺失数据进行插值、统一时间频率;所述剔除异常数据是通过设置阈值和变化率阈值,对异常数据进行剔除;所述剔除重复数据是将日期重复的数据剔除以及将连续时间段重复相同数值的数据剔除;所述对小段缺失数据进行插补的过程为:针对天频数据,若数据只缺失1天,则采用线性插值将其填充,针对时频数据,若数据只缺失1小时,则采用前1个小时数据与后一个小时数据进行线性插值填充,若数据连续缺失小于24小时,且前一天数据与后一天数据均完整,则采用前一天该时刻和后一天该时刻的数据进行线性插值填充,其余情况不进行插补;所述统一时间频率是将水温数据均统一为天频数据。
采用上述技术方案后,本发明与背景技术相比,具有如下优点:本发明为预测水温的变化趋势,利用观测水温数据构建LSTM神经网络模型;为准确预报水温的突变点,对实测水温和预报气温数据进行差分,基于预报气温差分值、实测水温值构建纯差分回归预测模型,基于预报气温差分值、实测水温差分值和实测水温值构建混差分回归预测模型;采用动态加权的方式将三个模型组合成水温在线预测模型,预测精度高、结果可靠,可实现未来7天的水温数值预测,为渔业生产、科研与管理提供水温等级预警信息服务。
附图说明
图1为本发明的流程图;
图2为本发明的流程框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参阅图1至图2,基于LSTM与差分回归模型动态加权的海湾水温组合预测方法,包括以下步骤:
S1、收集海湾的水温数据和气象数据,并进行数据预处理;
步骤S1中所述水温数据包括日最高水温、日最低水温和日平均水温;所述气象数据包括气象观测数据和气象预报数据;所述气象观测数据包括气温统计量、气压统计量、相对湿度统计量、风速统计量、风向统计量和降水,时间分辨率为1天;所述气象预报数据包括每天更新的未来7日气象预报数据,未来7日气象预报数据包括未来7日的日最高温和日最低温;
步骤S1中所述数据预处理包括剔除异常数据、剔除重复数据、对小段缺失数据进行插值、统一时间频率;所述剔除异常数据是通过设置阈值和变化率阈值,对异常数据进行剔除;所述剔除重复数据是将日期重复的数据剔除以及将连续时间段重复相同数值的数据剔除;所述对小段缺失数据进行插补的过程为:针对天频数据,若数据只缺失1天,则采用线性插值将其填充,针对时频数据,若数据只缺失1小时,则采用前1个小时数据与后一个小时数据进行线性插值填充,若数据连续缺失小于24小时,且前一天数据与后一天数据均完整,则采用前一天该时刻和后一天该时刻的数据进行线性插值填充,其余情况不进行插补;所述统一时间频率是将水温数据均统一为天频数据;
S2、根据预处理后的数据,构建LSTM神经网络预测模型,以及对每日预报气温数据、水温数据进行差分,得到预报气温差分值和实测水温差分值;
步骤S2的具体过程为:
S21、对水温数据进行归一化处理,并将水温数据和气象观测数据按0.8:0.2的比例划分为训练集和测试集;
步骤S21中归一化处理的计算公式为:
其中,X是原始实测数据,X
S22、基于水温数据的训练集部分,将气象观测数据和过去若干天的水温数据进行组合得到组合数据,再将组合数据作为输入因子,未来7天的水温数据作为输出因子,构建得到LSTM神经网络预测模型;
步骤S22中所述过去若干天的水温数据是指选取不同时间长度的水温数据;所述组合数据是指将水温数据作为固定输入参数,与其它气象观测要素遍历的方式进行组合;
S23、对水温数据进行一阶差分;
S24、对每日获取的第一天气温数据进行一阶差分,并对每日获取的未来7日气温数据间进行一阶差分;
S3、训练、测试LSTM神经网络预测模型,选取最佳的LSTM神经网络预测模型;
步骤S3的具体过程为:
S31、基于水温数据的测试集部分,将组合数据输入到训练好的网络中,通过反归一化,得到未来7天的日频水温预测结果;
步骤S31中反归一化公式为:
X
其中,X
S32、对比预测结果和实测数据,以水温预警等级准确率、均方根误差RMSE、平均绝对误差MAE和决定系数R
步骤S32中所述水温预警等级准确率的计算公式为:
其中,水温等级的划分参照大黄鱼的适宜生长温度,共有7个等级,见表1;
表1.水温等级的划分
等级预测结果说明见表2。
表2.等级预警结果说明
注:红低:红色低温;橙低:橙色低温;黄低:黄色低温;黄高:黄色高温;
橙高:橙色高温;红高:红色高温;
以均方根误差RMSE为最重要的指标,对所有训练好的模型进行测试,选取在验证集和测试集中精度最高的模型为最佳的LSTM神经网络预测模型;
S4、基于预报气温差分值、实测水温值构建纯差分回归预测模型;基于预报气温差分值、实测水温差分值和实测水温值构建混差分回归预测模型;
步骤S4中纯差分回归预测模型的构建方法为:
设第k天发布的气象预报的气温预测值分别为
第n(2≤n≤7)天水温预测值
其中,w
通过线性回归方程的方式选取w
设第k天发布的气象预报的气温预测值分别为
其中,x
步骤S4中混差分回归预测模型的构建方法为:
设第k天发布的气象预报的气温预测值分别为
第n(2≤n≤7)天水温预测值
其中,w
通过线性回归方程的方式选取w
设第k天发布的气象预报的气温预测值分别为
其中,x
S5、将最佳的LSTM神经网络预测模型、纯差分回归预测模型与混差分回归预测模型基于动态加权的方式组合成水温在线预测模型,并采用水温在线预测模型对海湾的水温进行预测;
步骤S5中所述动态加权的方式为:设置最佳的LSTM神经网络预测模型、纯差分回归预测模型与混差分回归预测模型的初始权重之比为1:1:1,以均方根误差RMSE为统计指标,每日对三个模型的预测精度进行统计,精度越大的令其权重更大,每日动态地更新组合模型的权重。若第二天LSTM神经网络预测模型的预测精度最高,则令LSTM神经网络预测模型的权重为(1+1)/(3+1)即1/2,令纯差分回归预测模型和混差分回归预测模型的权重均为1/(3+1)即1/4,将模型预测值乘以对应的权重并相加,就得到第二天组合模型对未来七天水温的预测结果;若第三天混差分回归预测模型的预测精度最高,则令混差分回归预测模型的权重为(1+1)/(3+2)即2/5,纯差分回归预测模型的权重为1/(3+2)即1/5,LSTM神经网络预测模型的权重为2/(3+2)即2/5,将模型预测值乘以对应的权重并相加,就得到第三天组合模型对未来七天水温的预测结果,以此类推。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
机译: 确定加权回归模型的方法和使用加权回归模型预测混合物组分浓度的方法
机译: 确定加权回归模型的方法和使用加权回归模型预测混合物组分浓度的方法
机译: 确定加权回归模型并使用该模型预测混合物成分浓度的方法