首页> 中国专利> 一种基于多变量LSTM的联合循环发电机组负荷预测方法

一种基于多变量LSTM的联合循环发电机组负荷预测方法

摘要

本发明涉及基于多变量LSTM的联合循环发电机组负荷预测方法,包括步骤:S1、数据采集;S2、数据预处理;S3、将其中一个机组数据划分为训练集和测试集,另外一个机组数据设置为验证集;S4、搭建多变量输入LSTM神经网络模型;S5、将验证集数据代入模型进行预测,采用联合循环功率作为机组负荷的预测目标;S6、针对模型训练中的损失值和预测中的均方根误差两种评价指标对模型进行评价;S7、生成真实值‑预测值曲线图。本发明的有益效果是:本发明高效利用海量联合循环电厂机组运行数据资源,结合历史存储资源,为燃气‑蒸汽联合循环发电机组的寿命预测提供可靠的依据。

著录项

  • 公开/公告号CN113107626A

    专利类型发明专利

  • 公开/公告日2021-07-13

    原文格式PDF

  • 申请/专利权人 浙大城市学院;

    申请/专利号CN202110569453.6

  • 申请日2021-05-25

  • 分类号F01K13/00(20060101);F01K13/02(20060101);F01K21/00(20060101);G06F30/27(20200101);

  • 代理机构33101 杭州九洲专利事务所有限公司;

  • 代理人张羽振

  • 地址 310015 浙江省杭州市拱墅区湖州街51号

  • 入库时间 2023-06-19 11:50:46

说明书

技术领域

本发明涉及复杂设备寿命预测领域,特别涉及基于多变量LSTM的联合循环发电机组负荷预测方法。

背景技术

火力发电作为现阶段国内发电装机容量和发电份额占比最大的发电模式,不仅需要消耗大量的煤矿资源,而且其能源转化率也不高,对环境的影响也不可忽视,因此,近年来,发电效率高、环保性好以及电网负荷调节能力更为灵活的燃气轮机联合循环发电逐渐推广投入生产。

随着国内电力系统信息集成化的推广普及,火电厂燃气轮机联合循环发电机组在运行过程中积累了海量的数据,这些数据与机组的运行状态有着密不可分的联系,如何挖掘该数据背后的潜在价值并加以利用,以指导火电厂机组的优化运行,进而促进电力绿色环保发展具有重要意义。当前,国内外多采用大数据研究方法,对机组进行实时监测和优化,对提高火电厂装置效率及寿命具有一定的意义,更进一步,通过机器学习手段,根据电厂机组历史运行数据对设定工况下未来机组的运行状态(如功率等)进行预测,从而提前做出有效的决策判断,调整机组相关联参数,以获得更高的经济效益,也具有广泛的研究价值。

近年来,随着人工智能技术的发展,越来越多的机器学习模型用于时间序列的数据预测未来。深度学习是机器学习发展最热门的分支,其中卷积神经网络(CNN)能有效处理空间信息,目前在机器视觉中广泛应用,长短期记忆(LSTM)神经网络能更好地处理时序信息,能有效地学习历史时序数据中的规律,并高效地预测未来某个时间点或时间段的数据分布情况,其在语音识别、机器翻译以及工业大数据领域的应用已相当成熟。然而,当前研究对评价燃气—蒸汽联合循环发电效益的联合循环功率的相关研究和预测相对较少,因此需要提出一种基于多变量LSTM神经网络的联合循环发电机组负荷预测方法。

发明内容

本发明的目的是克服现有技术中的不足,提供一种基于多变量LSTM的联合循环发电机组负荷预测方法。

这种基于多变量LSTM的联合循环发电机组负荷预测方法,包括以下步骤:

S1、数据采集:采集两组联合循环机组运行数据;根据实际需求布置相关传感器,采集与联合循环功率预测相关联的状态参数,包括空气质量流量(包含天然气质量流量)、大气温度、压气机进口空气温度及中压过热器出口蒸汽流量;

S2、数据预处理:对数据进行相关性分析,确定联合循环功率影响因素,并对其进行异常值处理、缺失值处理,归一化处理,并将数据转换为用于监督学习的数据类型;

S3、将其中一个机组数据划分为训练集和测试集,另外一个机组数据设置为验证集;

S4、搭建多变量输入LSTM神经网络模型,采用Python语言搭建神经网络,该网络包括一个输入层、一个中间层和一个输出层,依次连接,对时间序列数据进行特征提取和预测;并将训练集和测试集数据代入模型进行训练,设置训练集和测试集的比例、模型迭代次数、单次训练送入数据批量,并实时监测其损失函数值的变化;

S5、将验证集数据代入模型进行预测,采用联合循环功率作为机组负荷的预测目标;

S6、针对模型训练中的损失值和预测中的均方根误差两种评价指标对模型进行评价;

S7、生成真实值-预测值曲线图,直观评估模型的预测效果。

作为优选:所述步骤S1中,数据采集系统利用数据库技术,建立数据库管理系统,实现数据的交互和有效存储;该系统一方面与用户和云端进行数据交互,另一方面存储系统的部分历史数据,为机器学习模块提供训练样本。

作为优选:所述步骤S2中,所述的相关性分析采用皮尔森相关系数分析法,缺失值处理为均值补全法,通过缺失值两侧值的平均数补全空缺;异常值处理则直接舍弃,其中异常值是指偏离机组正常工作时状态参数范围的值;归一化处理采用最大最小值归一化,公式为:

式中:X

作为优选:所述步骤S4中,所述的输入层特征映射组为多维数组,其中采用步长为3滑动窗口将数组转化为用于监督学习的数据格式,将前3个时间点的功率影响因素和功率值与当前时间点的功率值进行映射。

作为优选:所述步骤S4中,多变量输入的LSTM网络模型预测是将设定时间步长n的数据与t时刻的待预测数据建立滑动窗口,即[t-n,t-1]时间段的输入数据和预测数据作为特征,t时刻的待预测值作为标签,用过去n个多变量输入来预测当前时刻的标签值,并依次在数据集上滑动,直至最后一个标签。

作为优选:所述步骤S4中,所述的中间层中,神经网络节点数设置为50,学习率设置为0.01,LSTM神经网络由输入门、遗忘门和输出门构成;

1)遗忘门f

遗忘门控制上一时刻的内部状态c

f

式中:f为sigmoid激活函数;W

2)输入门i

输入门控制当前时刻的候选状态

i

式中:W

3)输出门o

在记忆细胞将信息输出之前,通过输出门控制当前时刻的内部状态c

o

式中:W

作为优选:所述步骤S4中,所述的输出层采用全连接网络,将中间层预测的数值结果直接输出。

作为优选:所述步骤S4中,采用的模型识别评价标准为均方根误差e

式中:N为训练样本总数;

采用e

本发明的有益效果是:本发明高效利用海量联合循环电厂机组运行数据资源,结合历史存储资源,为燃气-蒸汽联合循环发电机组的寿命预测提供可靠的依据。该方法通过建立LSTM神经网络模型,利用电厂历史数据进行实验,以联合循环功率为预测变量,通过相关度分析提取功率影响因素,以平均绝对百分比误差作为模型优劣的评价标准,最终实现对未来某一时刻电厂联合循环功率的预测。

附图说明

图1是LSTM神经网络原理图;

图2是基于多变量LSTM的联合循环发电机组负荷预测流程图;

图3是本发明预测模型参数映射图;

图4是本发明功率影响因素相关性分析结果示意图;

图5是LSTM神经网络基本结构示意图;

图6为联合循环机组正常工作时采集的600个数据点的功率预测结果图;

图7为功率稳定分布在370kW到380kW的100个数据点的功率预测结果图;

图8是本发明与传统方法误差变化情况对比图。

具体实施方式

下面结合实施例对本发明做进一步描述。下述实施例的说明只是用于帮助理解本发明。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

本发明旨在通过建立LSTM神经网络模型,根据电厂联合循环机组运行历史数据中与联合循环功率相关联度较高的参数来预测未来特定时间点(段)的功率值(变化),从而为电厂确定机组零部件检修或更换提供技术支持。

实施例一

所述基于多变量LSTM的联合循环发电机组负荷预测方法,包括:数据采集、数据预处理、数据存储、LSTM神经网络建模、神经网络模型训练以及时间序列预测。

数据采集部分,根据实际需求布置相关传感器,采集与本发明联合循环功率预测相关联的状态参数,包括空气质量流量(包含天然气质量流量)、大气温度、压气机进口空气温度及中压过热器出口蒸汽流量等。

进一步地,所述的数据采集系统,第一步利用数据库技术,如SQL Sever,建立数据库管理系统,实现数据的交互和有效存储。该系统一方面与用户和云端进行数据交互,实现接收来自用户的数据、提前为用户缓存数据、向云端上传数据等功能,另一方面存储系统的部分历史数据,为机器学习模块提供训练样本。

数据预处理部分,需将采集得到的原始状态参数进行相关性分析,确定联合循环功率影响因素,并对其进行缺失值、异常值及归一化处理,以保证后续模型训练的效率。

进一步地,所述的相关性分析采用皮尔森相关系数分析法,所述的缺失值处理为均值补全法,通过缺失值两侧值的平均数补全空缺,异常值处理则直接舍弃,其中异常值是指偏离机组正常工作时状态参数范围的值,归一化处理采用最大最小值归一化,公式为:

式中:X

数据存储部分,利用SQL Sever数据库技术,建立联合循环发电机组工作状态数据库管理系统,实现数据的交互和有效存储。该系统一方面与用户和云端进行数据交互,实现接收来自用户的数据、提前为用户缓存数据、向云端上传数据等功能,另一方面存储系统的部分历史数据,为深度学习模块提供训练样本。

LSTM神经网络模型搭建部分,采用Python语言搭建神经网络,该网络包括一个输入层,一个中间层(隐含层)和一个输出层(具体网络结构可以根据特定的数据规模进行调整),依次连接,可以对时间序列数据进行特征提取和预测。

进一步地,所述的输入层特征映射组为多维数组(维度即为功率影响因素个数),其中采用步长为3滑动窗口将数组转化为可用于监督学习的数据格式,将前3个时间点的功率影响因素和功率值与当前时间点的功率值进行映射。

进一步地,多变量输入的LSTM网络模型预测原理是将设定时间步长(n)的数据与t时刻的待预测数据建立滑动窗口,即[t-n,t-1]时间段的输入数据和预测数据作为特征(feature),t时刻的待预测值作为标签(label),用过去n个多变量输入来预测当前时刻的标签值,并依次在数据集上滑动,直至最后一个标签。相较于仅使用待预测数据作为输入的单变量输入LSTM模型,该方法考虑的相关因素更为全面,预测准确率也更高。

进一步地,如图1所示为本发明采用的LSTM神经网络原理图,所述的隐含层中,神经网络节点数设置为50(具体参数可自行调整),学习率设置为0.01(经验法),LSTM神经网络由输入门、遗忘门、输出门构成,相应原理阐述如下:

1)遗忘门f

主要作用是控制上一时刻的内部状态c

f

式中:f为sigmoid激活函数;W

2)输入门i

主要作用是控制当前时刻的候选状态

i

式中:W

3)输出门o

在记忆细胞将信息输出之前,通过输出门控制当前时刻的内部状态c

o

式中:W

进一步地,所述的输出层采用全连接网络,将隐含层预测的数值结果直接输出。

神经网络模型训练部分,需要将上述处理后的数据输入待训练的LSTM神经网络中,设置训练集和测试集的比例(一般为4:1,数据量较大时可以适当提高测试集占比)、模型迭代次数(取500次,也可以根据数据量进行适当调整)、单次训练送入数据批量(32个样本,或16的整数倍),并实时监测其损失函数值的变化,最后以折线图的形式输出其误差。

进一步地,本发明采用的模型识别评价标准为均方根误差e

式中:N为训练样本总数;

本发明采用e

时间序列预测部分,本发明采用联合循环功率作为机组负荷的预测目标,将一批与训练集分布相同的新数据作为验证集输入训练完成的模型,并绘制模型预测结果与真实数据的对比曲线图。

实施例二

如图2所示为本发明基于多变量LSTM深度神经网络的联合循环发电机组负荷预测方法流程图,包括:数据采集及预处理、LSTM神经网络模型搭建、神经网络模型训练及预测。

具体包括以下步骤:

S1、数据采集:本实施例为某电厂两组联合循环机组(1号和3号机组)运行数据,共采集约16000条、66维度数据集;

S2、数据预处理:对数据进行相关性分析,异常值处理、缺失值补全,Pearson相关判定,归一化处理,并将数据转换为可用于监督学习的数据类型;

S3、将1号机数据划分为训练集和测试集,3号机数据设置为验证集;

S4、搭建多变量输入LSTM模型,并将训练集和测试集数据代入模型进行训练;

S5、将验证集数据代入模型进行预测;

S6、针对模型训练中的损失值和预测中的均方根误差两种评价指标对模型进行评价,两者越小,表明模型预测准确率越高;

S7、生成真实值-预测值曲线图,直观评估模型的预测效果。

实施例三

如图3所示,为本发明预测模型参数映射图,本发明所采用的数据为某电厂两台燃气-蒸汽联合循环发电机组2014年12月24日至2015年1月1日的运行数据,包括空气质量流量、天然气质量流量、联合循环功率等66个状态参数,其中只有部分状态参数与本文选定的联合循环功率高相关,需挑选与联合循环功率相关联度较大的状态参数作为后续模型训练及数据预测的输入,以降低数据维度,提高模型训练效率。

首先剔除停机状态下测得的样本数据,并将所有数据按照时间(机组运行小时数)排序。其次本文采用Pearson相关系数来衡量不同参数与联合循环功率的相关性,其中a-空气质量流量(天然气质量流量包含在其中,通过固定空燃比反映)、b-大气温度、c-压气机进口空气温度及d-中压过热器出口蒸汽流量这四个状态参数与e-联合循环功率的相关度高于50%(如图4),选取其作为模型的输入。

根据LSTM神经网络模型以及多变量输入时间序列预测的原理,本发明提出的燃气-蒸汽联合循环发电机组负荷预测模型,采用一个隐含层的LSTM网络,神经网络隐含层节点数为50,利用预测时间点之前的功率曲线和功率影响因素对预测时间点的功率进行预测,其基本结构如图5所示。图5中,模型的输出为预测时间点的功率值,如下式所示:

历史功率值为:

L

式中:l

功率影响因素为:

F

式中:a

建立的联合循环功率预测模型中,第T个时刻的输入由历史功率与功率影响因素构成,表示为I

神经网络模型搭建完成后,将预处理完成的1号机组数据按照训练集:测试集为4:1的比例输入到神经网络,设置模型迭代数epoch为500,每次小批量训练批量Batchsize为32,学习率a设置为0.01。

为检验本文提出的多变量输入燃气-蒸汽联合循环发电机组LSTM神经网络模型的预测效果,需将输入一批新数据(验证集),以验证模型的预测准确性。本文将3号机组的运行参数经过数据预处理后作为验证集输入模型进行预测,并将预测结果与真实数据进行对比,并与RNN和GRU算法进行对比。

3号机组的功率预测结果如图6、7所示,图6为联合循环机组正常工作时采集的600个数据点的预测结果,图7为功率稳定分布在370kW到380kW的100个数据点的预测结果。由图6、7可以看出基于LSTM神经网络的负荷预测无论在长距离预测稳定性还是短距离准确性都明显高于传统的RNN,但相对于GRU算法来说,两者不分伯仲。

进一步验证本发明采用的LSTM神经网络算法的性能,绘制三种算法测试过程中的平均绝对百分比误差变化情况,如图8所示。由图8可知,LSTM相较于其他两种方法,其损失函数值收敛速度比RNN快并且在模型迭代后期相对于GRU来说更稳定,每种算法的RMSE和MAPE值具体见表1所示。

表1评价指标

由图8和表1可知,LSTM神经网络的联合循环功率的预测效果整体较好,误差低至0.24%,性能相对稳定,在燃气-蒸汽联合循环发电厂性能预测具有更好的应用价值。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号