首页> 中国专利> 一种基于线性拟合的电站机组运行参数基准值获取方法

一种基于线性拟合的电站机组运行参数基准值获取方法

摘要

本发明公开了一种基于线性拟合的电站机组运行参数基准值获取方法,属于燃煤发电机组能耗分析技术领域,包括:获取电站机组的历史运行数据;将稳定工况下的历史运行数据划分为多个工况;对每个工况内的历史运行数据进行聚类,生成至少一组聚类数据簇及至少一个聚类中心;在至少一组聚类数据簇中,根据预设条件与聚类中心的相符程度选取最优的聚类数据簇;并将最优的聚类簇对应的聚类中位数作为每个工况的运行参数基准值;利用岭回归算法建立不同热值区间下主蒸汽流量与各基准值的回归模型,实时获取当前工况下的基准值。本发明采用不同热值区间范围基准值的联合建模进行运行基准值的挖掘,避免了由于数据量较少工况下的不准确性。

著录项

  • 公开/公告号CN114970766A

    专利类型发明专利

  • 公开/公告日2022-08-30

    原文格式PDF

  • 申请/专利权人 长春大学;

    申请/专利号CN202210758697.3

  • 发明设计人 李华;贾雪;高世权;荣婕妤;刘洁;

    申请日2022-06-30

  • 分类号G06K9/62(2022.01);G06F17/18(2006.01);G06Q10/04(2012.01);G06Q10/06(2012.01);G06Q50/06(2012.01);

  • 代理机构西安铭泽知识产权代理事务所(普通合伙) 61223;

  • 代理人韩晓娟

  • 地址 130012 吉林省长春市卫星路6543号

  • 入库时间 2023-06-19 16:33:23

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-09-16

    实质审查的生效 IPC(主分类):G06K 9/62 专利申请号:2022107586973 申请日:20220630

    实质审查的生效

说明书

技术领域

本发明涉及燃煤发电机组能耗分析技术领域,特别涉及一种基于不同热值区间线性拟合的电站机组运行参数基准值获取方法、装置和计算机设备。

背景技术

在电站机组生成运行过程中,为了提高机组的高效性和节能性,电站机组运行优化研究工作至关重要。运行参数基准值能够在生产运行中为机组提供可靠的指导作用,也是提高机组能效的关键手段。在工业生产运行中,往往会根据机组设计值或者行业标准来优化生产目标,而在实际生产中可能会对设备进行部分改造,或者随着设备的磨损,导致设计值难以达到优化目标,只有在正确确定运行参数基准值后,才能以此为目标减少机组运行的各项经济损失,从而提高机组运行经济型。

现阶段电厂随着负荷调峰的不断变化,机组工况是不断变化的,不适合取其设计值作为基准值,而通过实验的方法,由于部分数据量较少的工况,从而导致最终基准值的不准确。

发明内容

基于此,有必要针对上述技术问题,提供一种基于线性拟合的电站机组运行参数基准值获取方法、装置和计算机设备。

本发明实施例提供一种基于线性拟合的电站机组运行参数基准值获取方法,包括:

获取电站机组的历史运行数据;

将稳定工况下的历史运行数据划分为多个工况;

对每个工况内的历史运行数据进行聚类,生成至少一组聚类数据簇及至少一个聚类中心;

在至少一组聚类数据簇中,根据预设条件与聚类中心的相符程度选取最优的聚类数据簇;并将最优的聚类簇对应的聚类中位数作为每个工况的运行参数基准值;

利用岭回归算法,建立不同热值区间下主蒸汽流量与各基准值的回归模型;并根据回归模型,实时获取当前工况下的基准值。

进一步地,所述稳定工况下的历史运行数据的确定,包括:

对历史运行数据中的特征参数,根据多参数阈值进行基于方差的稳态工况筛选,获取稳定工况下的历史运行数据。

进一步地,所述稳态筛选对应的判定公式如下所示:

式中,n表示[t-d,d]时间段内数据点数量;d为时间间隔;

进一步地,所述特征参数,包括:

主蒸汽温度、主蒸汽压力、再热蒸汽温度、再热蒸汽压力、给水流量。

进一步地,所述将稳定工况下的历史运行数据划分为多个工况,包括:

使用热值区间将历史运行数据划分为至少两个初级工况;

使用主蒸汽流量区间将每个初级工况对应的历史运行数据划分为至少两个次级工况。

进一步地,所述对每个工况内的历史运行数据进行聚类,包括:

采用在线K-Means聚类算法,对每个工况内的历史运行数据进行聚类。

进一步地,所述在线K-Means聚类算法,包括:

输入数据集D(X

随机从数据集D中,抽取K个样本,记作

计算数据集D中的每一个样本x

计算每一个簇的均值,如果均值与聚类中心的距离小于∈,算法结束;否则,将计算的簇均值作为新的聚类中心,重新计算。

进一步地,所述利用岭回归算法,建立不同热值区间下主蒸汽流量与各基准值的回归模型,具体包括:

不同热值区间下每个工况对应于一个运行参数基准值,将每个工况映射到对应的主蒸汽流量取值作为输入x,不同的运行参数基准值为Y=(y1,y2,…,yp),依次对y1,y2,…,yp建立回归模型;

根据不同热值区间的数据量差距和每个热值区间的模型评价,选择一个热值区间的回归模型作为基础回归模型;

对于除与基础回归模型对应的热值区间外的其他各个热值区间,使用将每个工况映射到对应的主蒸汽流量取值作为输入x,输入基础回归模型中,得到预测值Y_1;并将Y_1作为输入,其他各个热值区间的不同运行参数基准值作为Y,重新建立回归模型。

本发明实施例提供的一种基于线性拟合的电站机组运行参数基准值获取装置,包括:

历史数据获取模块,用于获取电站机组的历史运行数据;

工况划分模块,用于将稳定工况下的历史运行数据划分为多个工况;

数据聚类模块,用于利用在线聚类算法,对每个工况内的历史运行数据进行聚类,生成至少一组聚类数据簇及至少一个聚类中心;

基准值确定模块,用于在至少一组聚类数据簇中,根据预设条件与聚类中心的相符程度选取最优的聚类数据簇;并将最优的聚类簇对应的聚类中位数作为每个工况的运行参数基准值;

线性处理模块,用于利用岭回归算法,建立不同热值区间下主蒸汽流量与各基准值的回归模型;并根据回归模型,实时获取当前工况下的基准值。

本发明实施例提供的一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现的步骤,包括:

获取电站机组的历史运行数据;

将稳定工况下的历史运行数据划分为多个工况;

对每个工况内的历史运行数据进行聚类,生成至少一组聚类数据簇及至少一个聚类中心;

在至少一组聚类数据簇中,根据预设条件与聚类中心的相符程度选取最优的聚类数据簇;并将最优的聚类簇对应的聚类中位数作为每个工况的运行参数基准值;

利用岭回归算法,建立不同热值区间下主蒸汽流量与各基准值的回归模型;并根据回归模型,实时获取当前工况下的基准值。

本发明实施例提供的基于不同热值区间线性拟合的电站机组运行参数基准值获取方法、装置和计算机设备,与现有技术相比,其有益效果如下:

本发明采用不同热值区间范围基准值的联合建模进行运行基准值的挖掘,从而使不同工况下的基准值有一定的紧密性,并避免了由于数据量较少工况下的不准确性,采用此方法灵活应对电站机组负荷调峰情况工况不断改变的问题,同时为机组调优提供了一种指导方向,便于下一步分析和实际应用。具体地,通过获取电站机组一定时间长度内的实际运行历史数据,对数据进行稳态筛选获取机组稳定工况下的数据;在此基础上,依据机组主蒸汽流量、入炉煤热值两个特征区间进行工况划分;利用聚类算法结合聚类评价函数能对机组运行指标的历史数据进行多参数同步聚类,在每个工况内,生成至少一组聚类数据簇,并根据预设条件选取最优聚类簇,确定最优聚类簇对应的聚类中位数作为各工况下的运行指标基准值;利用岭回归算法建立不同热值区间范围下,主蒸汽流量与各基准值的回归模型,从而实时提供当前运行情况下的运行参数基准值,为机组运行优化提供指导意见,本发明实施例应用于电力系统。

附图说明

图1为一个实施例中提供的基于不同热值区间线性拟合的电站机组运行参数基准值获取方法流程图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

一个实施例中提供的一种基于不同热值区间线性拟合的电站机组运行参数基准值获取方法,参见图1,该方法包括:

S1、本发明选取国内某电厂运行数据进行仿真,采样周期为1min,选取最近3-5个月的电站机组历史运行数据,得到原始样本数据。并采用箱型图法和机组启停信号删除其中的异常数据和未正常运行的数据。其中,原始样本数据量为196031,数据预处理后的数据量为147613。

S2、将历史数据进行稳态筛选,获取机组稳定工况下的数据。

针对历史运行数据,采用的多参数阈值判断法进行稳态工况筛选,分别是主蒸汽温度、再热蒸汽温度、主蒸汽压力、再热蒸汽压力和给水流量;根据每个参数方差阈值进行稳态工况筛选。具体为将原始样本数据中的主蒸汽温度、主蒸汽压力、再热蒸汽温度、再热蒸汽压力、给水流量五个特征参数根据阈值进行基于方差的稳态筛选,判定公式如下所示:

式中,n表示[t-d,d]时间段内数据点数量;

本实施例依次对上述的五个特征参数进行稳态筛选,最终得到机组稳定工况下的数据,数据量为79831。

S3、将稳定工况下的数据进行工况划分。

具体为使用热值区间将所述历史运行数据划分为至少两个大工况(初级工况),再使用主蒸汽流量区间将每个大工况的历史运行数据划分为至少两个小工况(次级工况)。

本实施例中热值区间取值范围为3000-4000,故将其划分成5个大工况,分别是热值3000-3200、热值3200-3400、热值3400-3600、热值3600-3800、热值3800-4000。对于主蒸汽流量来所,其取值范围是219-449,由于其稳定时的波动较大,故将其划分成有部分重合的工况,共计37个。

S4、采用聚类算法对每个工况内的历史运行数据进行聚类,生成至少一组聚类数据簇及至少一个聚类中心。

对上述每个工况内的历史运行数据使用K-Means聚类算法进行聚类,生成至少一组聚类数据簇及至少一个聚类中心。具体流程如下表1:

S5、在至少一组聚类簇中根据预设条件选取最优的聚类数据簇,并将最优聚类簇对应的聚类中位数作为每个工况的运行参数基准值。

首先再每个工况下至少一组聚类簇中,根据预设条件与聚类中心的相符程度,选取最优的聚类数据簇。再在最优聚类数据簇中,对应的聚类中位数作为每个工况的运行参数基准值。其中,运行参数基准值是指机组当前运行条件下,实际可达到的最优预设条件对应下的参数值。

S6、利用岭回归算法建立不同热值区间范围下,主蒸汽流量与各基准值的回归模型。

在获取的不同工况下机组运行参数基准值后,分别针对不同的热值区间建立岭回归模型,得到运行参数在每个热值区间内的基准值模型;在电站机组运行的状态下,实时获取当前工况下的基准值,为机组运行优化提供指导意见。具体地,根据上述获得5个热值区间范围内,每个热值区间范围各37个工况的运行参数基准值,使用岭回归算法建立回归模型。主要有三个步骤:一、针对每个热值区间,建立岭回归模型。以热值区间3000-3200为例,在该区间内,有37个工况,每个工况对应于一个运行参数基准值;将37个工况映射到对应的主蒸汽流量取值,作为x;不同的运行参数基准值为Y=(y1,y2,…,yp);依次对y1,y2,…,yp建立岭回归模型,记作f1,f2,…,fp。在模型训练时,以2:8的比例划分测试集和训练集,训练数据建模并存储到指定的“model”文件,同时输出建模用时;之后加载模型文件“model”带入验证数据进行预测,同时输出预测用时及该模型下的预测值与真值间的R2和MSE2来达到判断模型预测效果的目的。二、根据不同热值区间范围的数据量的差距和每个热值区间的模型评价选择一个热值区间的回归模型作为基础模型,以热值3400-3600为例。三、针对步骤二中未选择的四个热值区间,以热值3200-3400为例,使用热值3200-3400的37个主蒸汽流量数值作为x,输入热值3400-3600的岭回归模型中,得到预测值Y_1,并将Y_1作为输入,热值3200-3400的不同运行参数基准值作为Y,重新建立岭回归模型。

本发明实施例提供的电站机组运行基准值的获取方法具有以下优势:

本发明提供的数据稳态处理和工况划分方法,采用多参数阈值判断法进行稳态筛选并通过双重指标对机组稳定运行工况进行划分,有助于机组在不同工况下的运行优化研究。在此基础上,本发明利用岭回归算法,建立了不同热值区间具有一定联系的岭回归模型,将离散的基准值转换成连续型的基准值,能够避免由于部分数据量较少的工况导致的不准确的情况,并能够灵活应对不同工况下的运行优化研究。最终,通过采用本发明对电站机组运行基准值的确定,能够实时为电站机组提供当前工况下的基准值,为机组运行人员提供了较为具体的优化目标,并为电站机组的节能优化运行奠定了基础。

一个实施例中,提供的一种基于不同热值区间线性拟合的电站机组运行参数基准值获取装置,该装置包括:

历史数据获取模块,用于获取电站机组的历史运行数据。

工况划分模块,用于将稳定工况下的历史运行数据划分为多个工况。

数据聚类模块,用于利用在线聚类算法,对每个工况内的历史运行数据进行聚类,生成至少一组聚类数据簇及至少一个聚类中心。

基准值确定模块,用于在至少一组聚类数据簇中,根据预设条件与聚类中心的相符程度选取最优的聚类数据簇;并将最优的聚类簇对应的聚类中位数作为每个工况的运行参数基准值。

线性处理模块,用于利用岭回归算法,建立不同热值区间下主蒸汽流量与各基准值的回归模型;并根据回归模型,实时获取当前工况下的基准值。

关于基于不同热值区间线性拟合的电站机组运行参数基准值获取装置的具体限定可以参见上文中对于基于不同热值区间线性拟合的电站机组运行参数基准值获取方法的限定,在此不再赘述。上述基于不同热值区间线性拟合的电站机组运行参数基准值获取装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

一个实施例中,提供的一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:

获取电站机组的历史运行数据。

将稳定工况下的历史运行数据划分为多个工况。

对每个工况内的历史运行数据进行聚类,生成至少一组聚类数据簇及至少一个聚类中心。

在至少一组聚类数据簇中,根据预设条件与聚类中心的相符程度选取最优的聚类数据簇;并将最优的聚类簇对应的聚类中位数作为每个工况的运行参数基准值。

利用岭回归算法,建立不同热值区间下主蒸汽流量与各基准值的回归模型;并根据回归模型,实时获取当前工况下的基准值。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。还有,以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号