首页> 中国专利> 一种面向风场的临近预报与短期预报的融合系统

一种面向风场的临近预报与短期预报的融合系统

摘要

一种面向风场的临近预报与短期预报的融合系统,涉及气象与工程防灾的交叉领域,解决现有融合集成预报方法实现风速预测精确度难度较大的问题,该系统包括质量控制模块、误差特征分析模块、模型建设模块、检验模块和综合效果评估模块,本发明的临近预报与短期预报的融合系统,基于大量的站点实况数据、临近预报数据和短期数值预报数据,通过BP神经网络建立模型,该模型可简单快捷的生成融合数据。本发明所述的融合系统在北京区域业务化实时运行效果已被检验证实能够有效的提高风速的准确率。

著录项

说明书

技术领域

本发明涉及气象与工程防灾的交叉领域,具体涉及一种面向风场的临近预报与短期预报的融合系统,本发明适用于电网防灾、铁路运行、近海海域海上平台工程建设和运维等领域都需要更精准的风速预报预警。

背景技术

随着行业用户对精、准、快的专业气象服务需求不断增加,临近预报的应用越来越广泛,电网、铁路、风电、海上工程等用户对高影响天气尤其是强风临近预报的精准预警需求也越来越高,除了准确性要求,用户还希望预测时效能更长,而现有临近预报数据的技术思路多基于外推方法,其2小时内的预测可靠性较高,2小时之后预测准确性迅速下降,而短期数值预报对天气过程预测的可靠性相对稳定,针对这一现状,本发明拟基于临近预报数据和短期预报数据,研发了一种快速、精准的融合预测技术,本发明技术对提升风速的临近预报能力有重要作用。

目前传统的融合集成方法包括算术平均法、多元线性回归法、相关系数加权法。

所述算术平均法。即对每种预报数据的分配相同的权重,对它们进行集成融合预报。算术平均是最为简单的一种方法,它能滤掉大幅波动的信息,通常比单个预报数据要准确。但是该方法也会滤掉少数预报源数据报出的极端事件。

多元线性回归法。该方法是一个因变量(预报对象),多个自变量(预报因子)的回归模型。基本方法是根据各变量值算出交叉乘积和。应用此法,可以加深对定性分析结论的认识,并得出各种要素间的数量依存关系,从而进一步揭示出各要素间内在的规律。一般来说,多元回归过程能同时提供多个备选的函数关系式,并提供每个关系式对实验数据的理解能力,研究者可以结合自己的理论预期,据此作出选择。回归系数(即权重)不随时间变化的为固定模型集成预报,随时间变化的为滑动建模集成预报。该融合方法在解决线性问题上效果较好,但在解决非线性的问题上,在一定程度上会影响融合数据的预报效果。

相关系数加权法。利用实况数据和预报数据的相关系数作为权重,相关性越高的预报数据源分配的权重就越大。

综上所述,传统制作集成融合预报数据的基本思路是选用某种方法,确定各预报成员的权重,预报效果好的预报源数据分配的权重越大,预报效果差的预报源数据分配的权重小,进行加权得到一个新的预报数据。除此之外,还有多数表决集中法、动态评分权重法、贝叶斯模型平均方法以及机器学习等融合方法。彭九慧等采用多数表决集成法、评分权重集成法、多元回归集成法对承德市西来系统形成的降水进行晴雨和分级集成预报试验,结果显示细化的预报结果多元回归集成法是晴雨预报和分级降水预报中比较可行的方法。石岚等基于ECMWF、MM5、BJ-RUC三模式预报数据通过贝叶斯模型平均方法进行融合,其融合后预报对提升现有数值预报数据的精准度具有明显改进,平均绝对误差降低了24.3%、相关系数提升了12.5%。叶小岭等采用随机森林算法对多种边界层参数化方案下WRF模式的预报数据建立集成预报模型,试验结果表明风速融合数据的误差相比单一边界层参数化方案预报的风速误差明显减小。

综上所述,不论是基于何种的融合集成预报方法,多数情况下融合后新数据都优于单个成员预报。传统的集成融合方法能较好的解决线性问题,但是由于风速具有高度非线性、随机性和复杂性的特性,使得风速预测精确度的进一步提高难度较大。近年来,随着人工智能技术的迅猛发展,该技术在气象领域也开始得到广泛的应用。人工神经网络能够对非线性系统进行建模,相比于传统方法,人工智能模型能够较好地实现输入和输出之间的非线性识别,并具备较强的推广能力,这样便可以避免常规集成方法中难以确定权系数的困难问题。

发明内容

本发明为解决现有融合集成预报方法实现风速预测精确度难度较大的问题,提供一种面向风场的临近预报与短期预报的融合系统。

一种面向风场的临近预报与短期预报的融合系统,该系统包括质量控制模块、误差特征分析模块、模型建设模块、检验模块和综合效果评估模块;

所述质量控制模块:通过控制观测风速的阈值范围对观测的实况数据进行初步筛选;根据监测仪器的质控码剔除观测仪器检修期间或仪器运行异常时段的数据;并对风速较大的数据质量进行再确认,通过同站点时间序列前后时次的滑动平均值或者周边站点空间平均风速值进行对比,综合判别是否属于异常样本数据;

所述质量控制模块将筛选后的实况数据分为建模样本实况数据、模型相关样本实况数据和独立样本实况数据;

所述误差特征分析模块用于分别对临近预报数据的误差特征和短期预报数据的误差特征进行分析,分别获得临近预报数据的平均误差和绝对误差,临近预报数据平均误差和绝对误差分别在时效上的差异以及在空间分布上的差异,临近预报数据的误差概率密度分布;短期预报数据的平均误差和绝对误差,短期预报数据平均误差和绝对误差分别在时效上的差异以及在空间分布上的差异,以及短期预报数据的误差概率密度分布;

通过对比临近预报数据和短期预报数据对同一站点的误差概率密度分布的偏度指标,对临近预报数据和短期预报数据误差概率密度分布均是非正态分布的站点予以剔除;

所述模型建设模块接收误差特征分析模块输出的各个站点临近预报数据平均误差和绝对误差,短期预报数据平均误差和绝对误差;

接收质量控制模块筛选后的建模样本实况数据;

以及与所述建模样本实况数据同时段内的临近预报数据和短期预报数据;

采用BP神经网络算法建立预报模型,并对所述预报模型进行训练,训练后的预报模型输出融合预报数据;

所述检验模块采用模型相关样本实况数据对所述预报模型进行检验,对所述融合预报数据在各个时效的平均误差、绝对误差以及各站点的误差概率密度分布的峰度和偏度指标进行计算后传送至综合效果评估模块;

采用独立样本实况数据对所述预报模型进行检验,对所述融合预报数据在各个时效的平均误差、绝对误差以及各站点的误差概率密度分布峰度和偏度指标进行计算后传送至综合效果评估模块;

所述综合效果评估模块接收所述检验模块输出的平均误差、绝对误差以及各站点的误差概率密度分布的指标,在对比用户服务需求指标、行业标准以及其他预报数据的预报效果后,对预报模型进行调整,在分析检验模块输出融合数据的预报平均误差、绝对误差以及各站点的误差概率密度分布峰度和偏度指标后,将对所述预报模型的调整信息反馈至模型建设模块。

本发明的有益效果:

本发明所述的一种面向风场的临近预报与短期预报的融合系统,基于大量的站点实况数据、临近预报数据和短期数值预报数据,通过BP神经网络建立模型,该模型可简单快捷的生成融合数据。

本发明所述的融合系统在北京区域业务化实时运行效果已被检验证实能够有效的提高风速的准确率。

附图说明

图1为本发明所述的一种面向风场的临近预报与短期预报系统的原理框图;

图2为临近预报数据平均误差随时效的变化图;

图3为临近预报数据绝对误差随时效的变化图;

图4为短期预报数据平均误差随时效的变化图;

图5为短期预报数据绝对误差随时效的变化图;

图6为未来12小时临近数据误差空间分布图;

图7为未来12小时短期数据误差空间分布图;

图8为前2小时临近数据误差空间分布图;

图9为前2小时短期数据误差空间分布图;

图10为临近数据预报误差概率密度分布图(54406站);

图11短期数据预报误差概率密度分布图(54406站);

图12为短期数据预报误差概率密度分布图(651067站);

图13为线性回归融合预报数据误差和短期预报数据误差概率密度对比图(54433站);

图14为BP神经网络融合预报数据误差和短期预报数据误差概率密度对比图(54514站);

图15为2020年8~9月临近预报、短期预报、线性回归、机器学习预报数据平均误差(a)和绝对误差(b)随时效变化图。

具体实施方式

具体实施方式一、结合图1说明本实施方式,一种面向风场的临近预报与短期预报的融合系统,通过人工神经网络建立模型,以临近预报和短期数值预报为输入源数据,得出准确率更高的风速。包括质量控制模块、误差特征分析模块、模型建设模块、检验模块和综合效果评估模块;

质量控制模块:通过控制实况观测风速的阈值范围(0≤V≤50m/s)对观测数据进行初步的筛选;根据监测仪器的质控码剔除观测数据质量差以及观测仪器异常时段的数据;针对风速较大(V≥24m/s)的数据质量进行再确认,通过同站点时间序列前后时次的滑动平均值或者周边站点空间平均风速值进行对比,综合判别是否属于异常样本数据;如果当前时次风速(V

质量控制模块筛选后的实况数据可按照该融合系统中的使用目的可分为建模样本实况数据、模型相关样本实况数据、独立样本实况数据。从过去一段时期内的实况数据内随机抽取2/3的样本作为建模样本实况数据,剩余的1/3样本数据为模型相关样本实况数据,建模样本实况数据和模型相关样本实况数据的观测时段相同,而独立样本实况数据的观测时段异于前两者样本数据。

误差特征分析模块:分别对临近预报数据的误差特征和短期预报数据的误差特征进行分析,获得临近预报数据的平均误差和绝对误差,临近预报数据平均误差和绝对误差分别在时效上的差异以及在空间分布上的差异,临近预报数据的误差概率密度分布;短期预报数据的平均误差和绝对误差,短期预报数据平均误差和绝对误差分别在时效上的差异以及在空间分布上的差异,以及短期预报数据的误差概率密度分布。通过对比临近预报数据和短期预报数据对同一站点的误差概率密度分布的偏度指标,对于两种预报数据误差概率密度分布均是非正态分布的站点予以剔除,该站点实况数据和预报数据均不能用于建模训练,可进一步提高建模数据的有效性,从而起到优化模型的作用。

所述模型建设模块接收误差特征分析模块输出的各个站点临近预报数据平均误差和绝对误差,短期预报数据平均误差和绝对误差;

接收质量控制模块筛选后的建模样本实况数据;

以及与所述建模样本实况数据同时段内的临近预报数据和短期预报数据;

采用BP神经网络算法建立预报模型,并对所述预报模型进行训练,训练后的预报模型输出融合预报数据;

本实施方式中,所述模型建设模块采用BP(back propagation)神经网络算法建立预报模型。该算法是一种按照误差逆向传播算法训练的多层前馈神经网络。基本思想是梯度下降法,利用梯度搜索技术,以期使网络的实际输出值和期望输出值的误差最小。通过调整输入节点与隐层节点的联接强度和隐层节点与输出节点的联接强度以及阈值,使误差沿梯度方向下降,经过反复学习训练,确定与最小误差相对应的网络参数(权值和阈值),训练即告停止。建设模型期间,输入源数据包括质量控制模块筛选后的建模样本实况数据以及同时段内的两种预报数据(临近预报数据和短期预报数据),经过训练使预测值与各个站点实况观测的误差趋于最小。此时经过训练的神经网络即能对类似样本的输入信息,自行处理输出误差最小的经过非线形转换的信息。

所述检验模块用于衡量融合数据的预报效果,所述检验模块按照参与检验的样本实况数据不同,可分为模型相关样本检验和独立样本检验。模型相关样本检验是采用模型相关样本实况数据对所述预报模型进行检验。

所述模型相关样本实况数据是质量控制模块筛选后剔除参与建模样本后剩余的1/3数据;针对融合后的预报数据分别对各个时效的平均误差、绝对误差以及各站点的误差概率密度分布的峰度和偏度等指标进行计算后传送至综合效果评估模块;

独立样本检验是采用独立样本实况数据对所述预报模型进行检验,所述独立样本实况数据与质量控制模块筛选后的建模样本实况数据和模型相关样本实况数据属于不同时段的数据,针对融合后的预报数据分别对各个时效的平均误差、绝对误差以及各站点的误差概率密度分布峰度和偏度等指标进行计算后传送至综合效果评估模块;由于模型相关样本实况数据和建模样本实况数据属于同一时段,两者包含的风速信息具有类似性,利用模型相关样本实况数据获得的检验效果并不能充分证明模型预报性能的普遍性;独立样本实况数据中包含的风速信息和建模样本实况数据完全不同,利用独立样本实况数据获得的检验效果能够充分证明模型预报性能的普遍性;

所述综合效果评估模块根据检验模块给出的平均误差、绝对误差以及各站点的误差概率密度分布的指标,在对比用户服务需求指标、行业标准以及其他预报数据的预报效果后,综合考虑是否对模型进行调整,在分析检验模块给出融合数据的预报平均误差、绝对误差以及各站点的误差概率密度分布峰度和偏度等指标后,将改进方案反馈于模型建设模块以达到对模型的进一步优化升级。

具体实施方式二、结合图2至图15说明本实施方式,本实施方式为具体实施方式一所述的一种面向风场的临近预报与短期预报系统的实施例:

将本实施所述的一种面向风场的临近预报与短期预报系统对北京区域进行应用。模型建立选取了2019年10月份、2020年1月份、4月份、7月份等四个特征月份为样本数据。实况数据采用国家和区域自动站资料作为实况观测数据,其中国家站20个,区域站567个,共计587个站点。经过初步的质量控制后,符合条件的站点合计有363个站点。采用了多元线性回归和BP神经网络两种方案分别进行建模,并对相关样本实况数据和独立样本实况数据进行了检验比较。

如图2和图3所示,首先对临近预报数据和短期预报数据分别进行误差分析。从未来12小时临近预报数据的平均误差和绝对误差可以看出:临近预报数据对风速的预报普遍偏大;1~6小时预报的平均误差和绝对误差呈线性增长;6小时以后误差趋于稳定,平均误差稳定在1.3m/s左右,绝对误差稳定在1.6m/s左右,相比而言,2020年4月份误差最大,7月份误差最小。

如图4和图5所示,从未来12小时短期预报数据的平均误差和绝对误差可以看出:短期预报数据对风速的预报也普遍偏大;1~6小时内误差相对稳定,大体上呈现缓慢增加的趋势,2019年10月份、2020年1月份、4月份的平均误差呈现先减小,再增大的变化。短期预报数据的平均误差在0.6m/s左右,绝对误差在1.1m/s左右。

如图6和图7所示,从临近预报数据和短期预报数据的未来12小时误差变化中可以看出:临近预报数据在前2小时内有明显的优势,第3小时的预报误差大小基本和短期预报数据效果持平。4~6小时内,临近预报数据误差逐渐增大,6小时之后误差开始趋于稳定。7~12小时,临近预报数据误差高于短期预报数据。

如图8和图9所示,从未来12小时临近预报数据和短期预报数据误差空间分布图中可以看出:总体上,临近预报数据各个站点的误差大于短期预报数据。这主要由于临近预报数据从第4小时开始便高于短期预报数据。从前2小时临近预报数据和短期预报数据误差空间分布图中可以看出:临近预报数据前2小时总体优于短期预报数据,且在北京的城区以及平原地区东南部的预报效果明显优于短期数据。

通常预报误差概率密度分布呈现正态分布,即具有集中性、对称性、均匀变动性。集中性表现为正态曲线的高峰位于正中央,即均数所在的位置。对称性表现为正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。均匀变动性表现为正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。通过对各个站点临近预报数据和短期预报数据分布做的预报误差概率密度函数来看,大部分站点概率密度呈现正态分布的特征,如图10和图11所示。少部分站点概率密度呈现偏态分布,如图12所示。为了提高模型的普适性和有效性,根据误差概率密度分布,对样本站点再次进行筛选,剔除临近预报数据和短期预报数据的误差概率密度分布均为非正态分布的站点,误差异常分布的站点有87个,最终剩余276个有效站点用于建立模型。

本实施过程中,针对北京区域的实施示例中还采用了传统的多元线性回归建模方案用于对比神经网络建模方案的预报效果。通过随机抽样总样本的2/3样例作为建模样本实况数据,剩下1/3样本作为模型相关样本实况数据进行检验。采用多元线性回归模型方案求得关系:

Y=0.3198+0.1805×X

其中,X

首先采用模型相关样本实况数据分别利用2种模型的融合数据进行效果检验。分析各个站点概率密度分布发现,融合后的风速误差概率密度更趋向正态分布,且高峰位置向0点移动,说明融合数据能有效减少预报数据的系统性误差。如图13和图14所示,实线分别是线性回归融合预报数据和BP神经网络融合预报数据的误差概率密度拟合曲线,虚线为临近预报数据的误差概率密度拟合曲线,从图中可以看出实线的高峰值相比虚线更加逼近0。证明两种融合模型成功有效。

再采用质量控制后的北京区域内2020年8月份和9月份实况数据作为独立样本实况数据分别利用2种模型的融合数据进行效果检验。从检验效果来看,临近预报数据1~6小时误差增大较快,风速绝对误差分别为0.77m/s、0.93m/s、1.08m/s、1.23m/s、1.39m/s、1.59m/s,6~12小时绝对误差稳定在1.56m/s左右;短期预报数据1~12小时误差相对稳定,风速绝对误差在0.98m/s左右。线性回归融合预报数据在1~12小时误差有缓慢增长的趋势,风速绝对误差在0.72m/s左右。BP神经网络融合预报数据在1~12小时误差也相对稳定,风速绝对误差在0.64m/s左右。2种方案的融合数据对未来12小时时效内的预报效果均优于目前的临近预报数据或短期预报数据的单一数据,并且BP神经网络融合预报数据要略优于线性回归融合预报数据。所以,融合数据在北京区域的业务化应用后的检验分析说明本发明能有效提高风速的预报效果。

以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号