首页> 中国专利> 一种基于多源数据融合的光伏功率组合预测方法及系统

一种基于多源数据融合的光伏功率组合预测方法及系统

摘要

本发明公开了一种基于多源数据融合的光伏功率组合预测方法及系统,包括:获取历史发电功率序列数据以及待预测日外部气象数据;将所述数据分别输入到训练好的卷积神经网络子预测模型、长短期记忆网络子预测模型和极端梯度增强树子预测模型进行光伏功率预测;根据待预测日当日的云量指标进行天气类型的归类,进而确定每一个子预测模型的预测权重;基于所述权重将上述子预测模型的预测结果进行融合,得到最终的光伏功率预测结果。本发明将各种不同的架构的数据信息进行了综合,充分分析了历史功率数据、气象数据以及卫星云图数据的特点,然后融合出统一的,比单一数据更好、更丰富的信息。

著录项

说明书

技术领域

本发明涉及光伏功率组合预测技术领域,尤其涉及一种基于多源数据融合的光伏功率组合预测方法及系统。

背景技术

本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。

随着全球变暖与能源危机的矛盾日益加剧,可持续清洁能源在过去几年得到了迅速发展。太阳能是取之不尽用之不竭的能源,被认为是传统能源最受欢迎的替代品。因此,近年来光伏发电并网的比例不断增加。据统计,光伏总装机容量已超过400GW。但太阳能的间歇性和波动性特征给电力系统带来了很大的危险,很大程度上阻碍了光伏场站的大规模部署。为了保证电力系统的安全稳定,光伏功率预测方法和系统逐步成为电力系统不可或缺的一部分。精准的光伏功率预测可以促进需求响应方案的实施,同时还能够提高电能质量。

按照时间尺度划分,光伏功率预测技术可以分为短期预测(应能预测次日零时起至未来72小时的光伏发电站输出功率,时间分辨率为15分钟)、超短期预测(应能预测未来15分钟至4小时的光伏发电站输出功率,时间分辨率为15分钟)以及分钟级预测(预测时间尺度为0-2小时,时间间隔不大于5分钟)。光伏发电功率超短期预测需要提供未来4小时以内光伏发电功率数据,与短期预测相比,由于被预测时段更短更接近预测时刻,并且会作为电网实时调度的依据,因而对其预测精度,尤其是非晴朗天气状态下功率快速波动的追踪预测能力要求更高。

目前在光伏发电功率超短期预测中常用的模型算法主要包括:统计法、物理法以及云图法。统计法主要包括时间序列分析、自回归分析等统计学方法,同时近年来热门的人工神经网络以及支持向量机等方法也可归于统计法的范畴。物理方法主要基于数值天气预报(NWP)数据,借助分析手段探寻气象因子与光伏功率之间的相关性,并建立它们之间的映射关系。云图中含有云运动状态以及分布情况等大量信息,因此近年来将云图作为辅助信息进行光伏预测的方法不断涌现。然而受天气状态变化影响,辐照度与功率数据的超短期波动特性多种多样,各预测算法也均具有自身的局限性,目前还很难找到一种在任何天气状态下都适用的算法理论。

发明内容

为了解决上述问题,本发明提出了一种基于多源数据融合的光伏功率组合预测方法及系统,充分融合历史功率数据、气象数据以及卫星云图数据的特点,能够实现光伏功率的超短期预测。

在一些实施方式中,采用如下技术方案:

一种基于多源数据融合的光伏功率组合预测方法,包括:

获取历史发电功率序列数据以及待预测日外部气象数据;

将所述数据分别输入到训练好的卷积神经网络子预测模型、长短期记忆网络子预测模型和极端梯度增强树子预测模型进行光伏功率预测;

根据待预测日当日的云量指标进行天气类型的归类,进而确定每一个子预测模型的预测权重;

基于所述权重将上述子预测模型的预测结果进行融合,得到最终的光伏功率预测结果。

在另一些实施方式中,采用如下技术方案:

一种基于多源数据融合的光伏功率组合预测系统,包括:

数据获取模块,用于获取历史发电功率序列数据以及待预测日外部气象数据;

功率预测模块,用于将所述数据分别输入到训练好的卷积神经网络子预测模型、长短期记忆网络子预测模型和极端梯度增强树子预测模型进行光伏功率预测;

预测权重模块,用于根据待预测日当日的云量指标进行天气类型的归类,进而确定每一个子预测模型的预测权重;

数据融合模块,用于基于所述权重将上述子预测模型的预测结果进行融合,得到最终的光伏功率预测结果。

在另一些实施方式中,采用如下技术方案:

一种终端设备,其包括处理器和存储器,处理器用于实现各指令;存储器用于存储多条指令,所述指令适于由处理器加载并执行上述的基于多源数据融合的光伏功率组合预测方法。

在另一些实施方式中,采用如下技术方案:

一种计算机可读存储介质,其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行上述的基于多源数据融合的光伏功率组合预测方法。

与现有技术相比,本发明的有益效果是:

1.本发明将各种不同的架构的数据信息进行了综合,充分分析了历史功率数据、气象数据以及卫星云图数据的特点,然后融合出统一的,比单一数据更好、更丰富的信息。

2.本发明根据不同数据信息的类型特点选择合适的子模型,避免了因模型选取不恰当而影响预测效果,同时考虑了多种天气条件带来的影响,普适性与移植性更强。

3.本发明在最大信息利用的基础上最优组合了多种单一模型所包含的信息,同时考虑了不同模型各自的优点,相比于单一模型预测方法,可以明显提高光伏功率预测的精度。

本发明的其他特征和附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本方面的实践了解到。

附图说明

图1为本发明实施例中基于多源数据融合的光伏功率组合预测方法流程图;

图2为本发明实施例中卷积神经网络子模型的结构流程图;

图3为本发明实施例中长短期记忆网络子模型的结构流程图;

图4为本发明实施例中极端梯度增强树子模型的结构流程图;

图5为本发明实施例中各个子模型的光伏功率预测结果图;

图6为本发明实施例中组合模型的光伏功率预测结果图;

图7为本发明实施例中不同模型的预测误差结果对比图。

具体实施方式

应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本发明使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。

实施例一

根据本发明的实施例,公开了一种基于多源数据融合的光伏功率组合预测方法,参照图1,包括以下步骤:

(1)获取历史发电功率序列数据以及待预测日外部气象数据;

(2)将所述数据分别输入到训练好的卷积神经网络子预测模型、长短期记忆网络子预测模型和极端梯度增强树子预测模型进行光伏功率预测;

(3)根据待预测日当日的云量指标进行天气类型的归类,进而确定每一个子预测模型的预测权重;

(4)基于所述权重将上述子预测模型的预测结果进行融合,得到最终的光伏功率预测结果。

本实施例充分考虑了功率数据、气象数据以及卫星云图数据等多源异构数据各自的类型特点,并据此分别选取合适的深度学习方法,实现了多数据源与多学习模型的最优匹配。同时依据气象条件进行样本划分,并利用PSO方法对不同子模型的预测结果进行融合,构建了不同气象条件下的组合预测模型,提高了预测精度。该方法的预测结果可以为光伏场站的检修以及发电计划的制定提供参考。

具体地,本实施例的详细实现过程如下:

首先应选取模型输入的相关影响变量。作为影响光伏功率波动的影响因素按照数据的来源主要可以划分为两大类:一种是使用内源性数据,即由当前和/或滞后时间序列组成的光伏场站的输出功率;另一种是使用外源性数据,这些数据可能来自本地测量、卫星图像、数值天气预报等(内容包括温度、相对湿度、光照辐度、云量、风速和风向、气压等)。

为了探究各种影响因素对光伏功率的影响程度,利用皮尔森相关系数来分析众多影响因素与光伏功率间的相关性。皮尔森相关系数计算式如(1)所示:

式中:I为影响变量:D为光伏功率实测值;N为测试样本个数;r为相关系数。

内源性数据主要包括历史发电功率序列,这里选取了t-1,t-2,t-3时刻的功率,t代表当前时刻。外源性数据主要包括气象因素,这里选取了温度、湿度、风速、降雨以及云量。表1给出了多种因素与光伏功率之间的相关性结果。从表中结果可以看出,温度、湿度、云量等外源性因素以及历史时刻功率等内源性因素与光伏功率相关性较高。因此选择温度、湿度、卫星云图以及历史功率等变量作为模型的输入变量。

表1影响变量和光伏功率之间的相关系数

然后构建光伏功率预测子模型;

大型光伏电站的发电量受很多因素的影响,单一的预测模型不能完全包含各种因素,尤其在极端天气情况下,单一模型没有充分的学习,可能会导致很大的预测误差。选择一定的组合方式把单一模型集成起来进行预测,最优组合多种单一模型所包含的信息,同时考虑了不同模型各自的优点,可以明显提高预测的精度。根据输入数据类型特点的不同,本发明分别构建了卷积神经网络(CNN)预测子模型,长短期记忆网络(LSTM)预测子模型以及极端梯度增强树(XGBoost)预测子模型。

在机器学习中,卷积神经网络(CNN)是一种深度前馈人工神经网络,擅长图像处理与特征提取,此模型可用于提取卫星云图中的云遮挡因素。长短期记忆网络(LSTM)是一种时间递归神经网络(RNN),适用于处理和预测时间序列中间隔和延迟较长的重要事件,可用于挖掘历史功率序列间的变化规律。极端梯度增强树(XGBoost)属于树模型,可以挖掘不同种类数据间的内在联系,此模型运算速度快、精度高,可用其建立气象因素与光伏功率之间的映射关系。

本实施例利用不同种类数据分别训练三个子预测模型。

1)卷积神经网络(CNN)

在机器学习中,卷积神经网络是一种深度前馈人工神经网络,已成功地应用于图像识别。目前,卷积神经网络已经成为许多科学领域的研究热点之一,尤其是在图像特征提取领域。由于该网络避免了对图像进行复杂的预处理,可以直接输入原始图像,因此得到了广泛的应用。卷积神经网络一般由五层组成:输入层、卷积层、池化层、全连通层和输出层。卷积层和池化层是其中的关键层。卷积运算可表示为(2):

其中w

在图像识别领域,有时图像过大,需要减少训练参数的数量。因此,在卷积层之间定期引入池化层。池化的唯一目的是减少图像的空间大小。池化是单独在每个深度维度上完成的,因此图像的深度保持不变。最常见的池化形式是最大池化和平均池化。而池化层的最终输出可以描述为(3):

其中y

云的运动是影响光伏发电并造成强烈波动的主要因素。卫星图像包含了大量关于云层形状和特征的信息。因此,卫星图像是超短期光伏功率精确计算的重要数据资源。深度卷积神经网络可以更好地理解云图像,这是很难用明确的公示表达的。因此,卷积神经网络子模型将卫星图像和卷积神经网络结合起来,利用卷积神经网络的优势可以更好地分析云遮挡对于光伏功率的影响。卷积神经网络子模型的结构流程如图2所示。

本实施例首先将卫星图像输入卷积神经网络,经过一系列卷积层和池化层以提取特征,感知云遮挡因素对光伏发电的影响。最后,从输出层得到光伏功率的预测值。

2)长短期记忆网络(LSTM)

长短期记忆网络是一种时间递归神经网络,适用于处理和预测时间序列中间隔和延迟较长的重要事件。长短期记忆网络和递归神经网络的主要区别是长短期记忆网络在算法中增加了一个处理器“cell”来判断信息是否有用。一个单元中有三个门,分别是输入门、遗忘门和输出门。在这里,输入门用于新数据的更新,遗忘门用于确定需要删除旧信息的哪一部分,输出门则负责长短期记忆网络的输出。新消息进入长短期记忆网络网络后,首先根据规则判断其是否有用,只留下符合算法认证的信息,不符合的信息通过遗忘门被遗忘,最后将处理好的数据通过输出门进行输出。

长短期记忆网络的工作流程如下。首先,将t时刻的输入x

i

f

C

o

h

式中:σ为激活函数,W为各阈值层的权值,x

时间序列预测分析使用事件在过去一段时间内的时间特征来预测该事件在未来一段时间内的特征。历史序列往往包含着特有的变化趋势。基于时间序列的超短期光伏功率预测模型主要用于历史光伏功率数据的趋势学习建模。目的是挖掘历史光伏功率的转换特征,并推断未来时刻的功率变化。长短期记忆网络是一种特殊的递归神经网络,解决了梯度消失和梯度爆炸的问题。同时,长短期记忆网络尤其擅长处理时间序列问题。由于相邻时刻的光伏功率之间存在一定的关系,长短期记忆网络子模型将历史功率数据与来长短期记忆网络结合,以实现历史光伏功率序列的分析和未来时刻光伏功率的预测。长短期记忆网络子模型的结构流程如图3所示。

本实施例将T-1、T-2、T-3时刻的光伏功率输入长短期记忆网络,训练与T时刻光伏功率之间的映射关系。

3)极端梯度增强树(XGBoost)

极端梯度增强树以其高效、高预测精度等优点近年来受到人们的广泛关注。极端梯度增强树是一个可扩展的机器学习系统中的推广方法,其属于一个树集成模型,它使用所有树的预测值之和作为样本的预测值。极端梯度增强树可以表示为(9):

其中K是树的个数,F是所有可能的CART树的集合,f

其中

目标函数经过泰勒二阶展开,然后去掉所有常数项,最后求偏导数得到目标函数的最优解,最优解可表示为(11):

其中w

目前数值天气预报已经成为预测光伏功率或辐照度最准确的工具。对于超短期光伏发电预测,在光伏设备不变的情况下,光伏发电主要受物理因素的影响。因此,可以选择相关性强的因子作为预测学习建模的特征。皮尔逊相关系数是反映两个变量之间相似程度的统计量,其取值范围为[-1,1]。当值为负时,为负相关;当值为正时,表示正相关。皮尔逊相关系数绝对值越大,正/负相关越大。一般来说,影响光伏发电的气象因素主要包括辐照度、风速、风向、温度、湿度、气压等。经过相关筛选,本文选取温度、湿度、太阳天顶角和辐照度作为输入。图4展示了极端梯度增强树子模型的流程结构。

本实施例将T时刻的影响变量输入极端梯度增强树模型,输出为T时刻的光伏功率,建立气象数据与光伏功率的映射关系。

为了综合深度学习技术和各种预测方法的优势,本实施例将三种预测子模型进行融合建立光伏功率组合预测模型。将卫星图像与卷积神经网络相结合,可以更好地提取云对阳光的遮挡作用。通过极端梯度增强树建立了气象因子与光伏功率的映射关系,实现了光伏功率的预测。同时,长短期记忆网络通过挖掘历史功率序列与预测时间功率之间的相关性,完成对光伏功率的超短期预测。

首先将依据多源数据对子模型进行单独训练。然后根据气象条件将天气类型划分为晴天、多云以及阴天情形,并据此将样本集划分为晴天集合、多云集合以及阴天集合。针对不同的样本集合,分别采用PSO算法获取各个子模型的最优权重,最后建立了不同气象条件下的组合预测模型。

具体的,PSO算法的理论如下:

粒子群算法通过设计一种无质量的粒子来模拟鸟群中的鸟,粒子仅具有两个属性:速度和位置,速度代表移动的快慢,位置代表移动的方向。每个粒子在搜索空间中单独的搜寻最优解,并将其记为当前个体极值,并将个体极值与整个粒子群里的其他粒子共享,找到最优的那个个体极值作为整个粒子群的当前全局最优解,粒子群中的所有粒子根据自己找到的当前个体极值和整个粒子群共享的当前全局最优解来调整自己的速度和位置。粒子群算法的优势在于简单容易实现并且没有许多参数的调节。目前已被广泛应用于函数优化、神经网络参数训练、模糊系统控制以及其他遗传算法的应用领域。

进行光伏功率预测时,首先将待预测日的输入变量(包括NWP数据、卫星云图以及历史功率数据)分别输入三个预测子模型进行预测,可获得三个子模型的预测结果。然后根据待预测日当日的云量指标进行天气类型的归类,若当日云量<30%,则认定该日为晴天;若当日30%<云量<70%,认定该日为多云;若当日云量>70%,则认定该日为阴天。最后依据待预测日的天气类型,选择相应天气类型下已经训练好的模型权重,将三个子模型的结果进行组合得到最终的预测结果。

本实施例采用了平均绝对误差(MAE)和均方根误差(RMSE)对该方法的性能进行了评价。表达式分别由式(12)和式(13)得到:

其中y(t)

本实施例采用风云2G卫星云图,该云图每小时更新一次。NWP资料由中国气象局提供。同时,以宁夏某30MW光伏场站的发电数据为例,验证了方法的有效性。数据日期为2018年1月至2018年11月,时间分辨率为15分钟。数据集分为训练集和测试集,为了保证通用性,测试集由每个季度中的随机挑选的天数组成,其余天数为训练集。由于晚上光伏发电量是零,故只选择时间当天上午9点和下午16点之间数据进行实验。

图5为各个子模型在上午9:00-下午16:00之间的光伏功率预测结果。图6为组合模型的光伏功率预测结果。从图5可以看出,不同子模型得到的结果是不一样的,而且波动较大。长短期记忆网络模型和极端梯度增强树模型均能表现出较好的预测性能,但预测值与真实值之间仍存在较大误差。对于卷积神经网络模型来说,在多云情况下,卫星云图能更好地反映功率的波动。然而,由于卫星图像的时间分辨率为1小时,很难对分钟级进行精细化的预测。因此各个模型的适用场景是不同的。长短期记忆网络可以通过挖掘历史发电功率之间的序列相关性进行时间序列的外推,可有效反应功率本身的时间变化趋势。极端梯度增强树模型拟合能力强,可以在大量数据中挖掘气象与光伏功率的相关关系。卷积神经网络适用于处理图像数据,因此可利用其对卫星云图中的云团特征进行提取,分析云团遮挡对于光伏功率波动的影响。通过两图可以看出,不同模型组合后,组合模型的预测结果更接近真实值,表明模型组合后展现出更强的普适性与准确性。

图7展示了不同模型的误差指标。首先,各个子模型预测结果的误差相差无几,但均大于组合模型,这也表明了子模型在组合后展现出更优越的预测性能。同时考虑了天气分类的组合模型可以根据不同的天气类型选择相应的权重,在图中也可以看出,考虑天气类型的组合模型预测结果的误差小于不考虑天气类型的组合模型预测结果的误差,这也验证了考虑天气类型的划分后,模型的预测精度进一步得到提升。表2为各个子模型以及组合模型在不同时间尺度下的预测误差对比。可以看出,在任一时间尺度,组合模型的精度均高于子模型预测精度。

表2不同时间尺度下各个模型的预测误差对比

实施例二

根据本发明的实施例,公开了一种基于多源数据融合的光伏功率组合预测系统,包括:

数据获取模块,用于获取历史发电功率序列数据以及待预测日外部气象数据;

功率预测模块,用于将所述数据分别输入到训练好的卷积神经网络子预测模型、长短期记忆网络子预测模型和极端梯度增强树子预测模型进行光伏功率预测;

预测权重模块,用于根据待预测日当日的云量指标进行天气类型的归类,进而确定每一个子预测模型的预测权重;

数据融合模块,用于基于所述权重将上述子预测模型的预测结果进行融合,得到最终的光伏功率预测结果。

需要说明的是,上述各模块的具体实现方式已经在实施例一中进行了详细的说明,不再赘述。

实施例三

根据本发明的实施例,公开了一种终端设备的实施例,其包括处理器和存储器,处理器用于实现各指令;存储器用于存储多条指令,所述指令适于由处理器加载并执行实施例一中所述的基于多源数据融合的光伏功率组合预测方法。

在另一些实施方式中,公开了一种计算机可读存储介质,其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行实施例一中所述的基于多源数据融合的光伏功率组合预测方法。

上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号