首页> 中国专利> 一种电厂设备测点健康基准值的预测方法及系统

一种电厂设备测点健康基准值的预测方法及系统

摘要

本发明涉及一种电厂设备测点健康基准值的预测方法及系统,方法包括:获取机组的历史运行数据,构建数据集;过滤数据集中的拉直线型数据;配置对应的启机判断式和设备运行模式判断式;构建机器学习模型,输入数据集训练机器学习模型,得到预测模型;将设备测点的实时数据输入预测模型,得到设备测点的健康基准值。与现有技术相比,本发明基于机器学习算法进行测点健康基准值预测,主要依赖于输入输出数据,灵活性较强,适用于电厂设备的动态建模,计算速度更快、预测精度更高、应用范围更广。

著录项

  • 公开/公告号CN114943175A

    专利类型发明专利

  • 公开/公告日2022-08-26

    原文格式PDF

  • 申请/专利权人 华能上海燃机发电有限责任公司;

    申请/专利号CN202210459629.7

  • 申请日2022-04-28

  • 分类号G06F30/27(2020.01);G06N20/00(2019.01);G06Q10/04(2012.01);

  • 代理机构上海科盛知识产权代理有限公司 31225;

  • 代理人蔡彭君

  • 地址 200942 上海市宝山区盛石路298号

  • 入库时间 2023-06-19 16:31:45

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-09-13

    实质审查的生效 IPC(主分类):G06F30/27 专利申请号:2022104596297 申请日:20220428

    实质审查的生效

说明书

技术领域

本发明涉及机组设备健康检测技术领域,尤其是涉及一种电厂设备测点健康基准值的预测方法及系统。

背景技术

随着国家对电力企业设备管理水平要求的提高,近年来发电机组逐渐以提高效率、节约能源、改善环境和降低成本为发展目标,尤其对于具备深度调峰能力的机组,严格的考核标准与复杂的运行状况互相矛盾,造成依靠传统控制手段的火电机组经济形势日趋严峻。如何充分利用互联网和大数据的平台来提升设备建模的质量,从而提高机组的运行效率,已经成为当前能源行业重点关注的问题。基于此,设备运行基准值的计算对于电厂中的测点预警以及设备故障检测就显得尤为重要。

就计算主要参数健康基准值的传统工业过程建模而言,一般多以机理建模为主,机理建模主要指根据系统的机理(如物理或化学的变化规律)建立系统模型的过程,首先,根据建模对象的应用场合和模型的使用目的进行合理的假设;随后,根据系统的内在机理建立数学方程,并比较过程变量数与独立方程数来进行自由度分析,以保证模型有解;最后,进行模型简化与验证。但机理建模往往存在着过于依赖过程内部机理的认识的问题,对具有复杂结构的工业过程往往难以求解;此外,机理模型不太适合描述动态的变化过程,难以对伴随着复杂物理化学变化的工业过程进行准确的建模。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种电厂设备测点健康基准值的预测方法及系统,基于有监督机器学习算法构建模型,主要依赖于输入输出数据,灵活性较强,适用于电厂设备的动态建模,实现准确的设备运行测点健康基准值的预测,解决了机理建模计算设备测点运行健康基准值时,对复杂过程难以求解、不适合动态工业过程等问题,提高了模型预测的准确性。

本发明的目的可以通过以下技术方案来实现:

一种电厂设备测点健康基准值的预测方法,包括以下步骤:

S1、获取机组的历史运行数据,包括设备的测点数据和健康基准值,并对数据进行预处理,构建包含多个样本的数据集;

S2、设置拉直线变化比率,过滤数据集中的拉直线型数据;

S3、对于机组中的设备,配置对应的启机判断式和设备运行模式判断式,对数据集中的样本进行判断和配置;

S4、使用机器学习算法构建机器学习模型,输入数据集训练所述机器学习模型,得到预测模型;;

S5、将设备测点的实时数据输入预测模型,得到设备测点的健康基准值。

进一步地,步骤S1中,自机组的厂级信息监测系统SIS中获取机组的历史运行数据,对数据进行预处理包括:进行空缺值、异常值的检测,去除存在空缺值、异常值的数据。

进一步地,步骤S2中,基于所述拉直线变化比率确定阈值范围,若某个时间区间内的测点数据的值在所述阈值范围内波动,则该时间区间上的数据为拉直线型数据。

进一步地,步骤S3中,所述启机判断式的构建为:确定设备开机和关机特征变化最显著的测点数据,以测点数据的变化作为设备的启机判断式。

进一步地,步骤S3中,所述设备运行模式判断式的构建为:对于存在多个运行模式的设备,确定设备不同模式下特征变化最显著的测点数据,,以测点数据的变化作为设备运行模式判断式。

一种电厂设备测点健康基准值的预测系统,包括:

数据集构建模块,获取机组的历史运行数据,包括设备的测点数据和健康基准值,并对数据进行预处理,构建包含多个样本的数据集;

拉直线型数据过滤模块,设置拉直线变化比率,过滤数据集中的拉直线型数据;

判断式配置模块,对于机组中的设备,配置对应的启机判断式和设备运行模式判断式,对数据集中的样本进行判断和配置;

模型构建模块,使用机器学习算法构建机器学习模型,输入数据集训练所述机器学习模型,得到预测模型;;

预测模块,将设备测点的实时数据输入预测模型,得到设备测点的健康基准值。

进一步地,还包括报警模块,所述报警模块将设备测点的实时数据输入预测模型,得到设备测点的健康基准值,计算测点的实时数据与健康基准值的实时偏差值,在实时偏差值大于预设置的偏差阈值时,标记该时刻,当标记的时刻连续且达到预设置的数量阈值时,发出测点异常报警信号。

进一步地,拉直线型数据过滤模块中,基于所述拉直线变化比率确定阈值范围,若某个时间区间内的测点数据的值在所述阈值范围内波动,则该时间区间上的数据为拉直线型数据。

进一步地,判断式配置模块中,所述启机判断式的构建为:确定设备开机和关机特征变化最显著的测点数据,以测点数据的变化作为设备的启机判断式。

进一步地,判断式配置模块中,所述设备运行模式判断式的构建为:对于存在多个运行模式的设备,确定设备不同模式下特征变化最显著的测点数据,,以测点数据的变化作为设备运行模式判断式。

与现有技术相比,本发明具有以下有益效果:

(1)基于机器学习算法进行测点健康基准值预测,主要依赖于输入输出数据,灵活性较强,适用于电厂设备的动态建模,计算速度更快、预测精度更高、应用范围更广。

(2)配置不同设备相应的启机判断式和运行模式判断式,对数据集中的数据进行判断和配置,进一步细化处理数据,在健康基准值预测模型中增加了有关设备启停和运行模式的考虑,提升了数据集的质量,预测得到的健康基准值精确度更高。

(3)通过数据预处理进行空缺值、异常值的检测,去除存在空缺值、异常值的数据,设置拉直线变化比率,数据波动不超过所设置的范围则认为是拉直线型数据,该段数据将被过滤,保证了用于模型训练的数据的质量,提高了预测模型的准确率。

附图说明

图1为一种电厂设备测点健康基准值的预测方法的流程图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。

在附图中,结构相同的部件以相同数字标号表示,各处结构或功能相似的组件以相似数字标号表示。附图所示的每一组件的尺寸和厚度是任意示出的,本发明并没有限定每个组件的尺寸和厚度。为了使图示更清晰,附图中有些地方适当夸大了部件。

实施例1:

一种电厂设备测点健康基准值的预测方法,如图1所示,包括以下步骤:

S1、获取机组的历史运行数据,包括设备的测点数据和健康基准值,并对数据进行预处理,构建包含多个样本的数据集;

S2、设置拉直线变化比率,过滤数据集中的拉直线型数据;

S3、对于机组中的设备,配置对应的启机判断式和设备运行模式判断式,对数据集中的样本进行判断和配置;

S4、使用机器学习算法构建机器学习模型,输入数据集训练所述机器学习模型,得到预测模型;

S5、将设备测点的实时数据输入预测模型,得到设备测点的健康基准值。

步骤S1中,自机组的厂级信息监测系统SIS中获取机组的历史运行数据,对数据进行预处理包括:进行空缺值、异常值的检测,去除存在空缺值、异常值的数据。

发电机组一般都有厂级信息监测系统(SIS),在SIS中存储着从机组分散控制系统(Distributed Control System,DCS)采集的历史数据。

发电厂部署应用软件通常只从SIS读取数据。SIS的核心技术是实时数据库(现在改称时序数据库),本方案需布署一台服务器,在服务器上部署与SIS实时数据库的接口程序,按上述若干测点采集历史运行数据,存入部署在服务器的开源的时序数据库。

将设备健康运行的历史数据按点名导入并构建数据集,为了保证数据的完备性,应当获取设备至少包含一整年的运行历史数据,过于久远的数据没有参考性,再按照时间进行数据筛选,基于设定的时间阈值,如原始数据时间跨度少于一年则不取。在此基础上,再去除空值型、异常值数据,一般由于现场传感器故障或数据传递异常等数据。

步骤S2中,基于拉直线变化比率确定阈值范围,若某个时间区间内的测点数据的值在阈值范围内波动,则该时间区间上的数据为拉直线型数据。

关于拉直线型异常数据的定义为:若某个时间区间的测点数据的值在设定的阈值范围内波动(可以理解的是,阈值范围是根据数据的不同类型而设置的),则该时间区间上的数据为拉直线型异常数据。需要说明的是,这些拉直线型异常数据异常的原因为,在一些异常情况下比如现场传感器故障,传送的数据点不是空值或者报错,而是会不间断地传送上一个测量到的正常值,体现在趋势图上就是拉一条直线,这是拉直线型异常数据的一种。还有一种测点即使拉直线也是正常情况,如阀位测点等,此类测点在设置时应关闭拉直线过滤功能。

发明人在实践中发现,历史运行数据的涵盖范围较大,仍需要进一步细化处理,因此,针对设备的特点,构建启机判断式和设备运行模式判断式,这样,针对设备测点健康基准值的预测能够对应设备的开关机状态和运行模式,从而使得预测更为准确,启机判断式和设备运行模式判断式的构建,提升了数据集的质量,进而提升了预测模型的预测精度。

步骤S3中,启机判断式的构建为:确定设备开机和关机特征变化最显著的测点数据,以测点数据的变化作为设备的启机判断式,如设备为发电机,启机判断式为电流大于某一设定值时为启机,此外,针对其他设备,还可以根据电压、转速等特征构建启机判断式,实际应用时根据设备的类型自适应设置即可,相关从业人员可以理解。

步骤S3中,设备运行模式判断式的构建为:对于存在多个运行模式的设备,确定设备不同模式下特征变化最显著的测点数据,以测点数据的变化作为设备运行模式判断式,如设备为泵,运行模式判断式为转速的高低,同理,针对其他设备,还可以针对电流、电压、温度、压力等数据判断运行模式,或者结合上述多个特征来判断设备的运行模式,实际应用时根据设备的类型自适应设置即可,相关从业人员可以理解。

具体的,本实施例中,使用的机器学习算法为贝叶斯超参数优化的XGBoost算法,构建的机器学习模型为XGBoost模型,构建模型所用到的健康工况历史运行数据分为训练集和测试集,把训练集导入算法程序,不断生成树,去拟合上次预测的残差,直到树达到最大深度、样本权重和小于设定阈值时停止生长。关于XGBoost求解多输出问题,这里运用sklearn.multioutput模块的multioutputregressor进行求解;使用Python的BayesianOptimization库,进行贝叶斯超参数寻优;用Java编程实现Python与时序数据库之间的样本输入和结果输出,该部分通过编写Python程序,调用Python机器学习库sklearn里的XGBoost算法模型完成模型训练、储存、预测以及评分,开始建模后,XGBoost模型收到随机样本和预测信息,调用编写好的Python程序训练,把预测结果传给Java程序,直至完成训练。

得到预测模型后,输入实时数据即可得到测定的健康基准值。

本发明从电厂具体设备导出相应测点、导入系统配置、从时序数据库选择相应时间段的历史数据后,设置启机判断式、运行模式判断式与数据过滤条件,提交后即可自动建模计算估计值与偏差值。较传统机理建模相比,基于机器学习算法的自动建模系统计算速度更快、预测精度更高、应用范围更广。

实施例2:

一种电厂设备测点健康基准值的预测系统,包括:

数据集构建模块,获取机组的历史运行数据,包括设备的测点数据和健康基准值,并对数据进行预处理,构建包含多个样本的数据集;

拉直线型数据过滤模块,设置拉直线变化比率,过滤数据集中的拉直线型数据;

判断式配置模块,对于机组中的设备,配置对应的启机判断式和设备运行模式判断式,对数据集中的样本进行判断和配置;

模型构建模块,使用机器学习算法构建机器学习模型,输入数据集训练所述机器学习模型,得到预测模型;

预测模块,将设备测点的实时数据输入预测模型,得到设备测点的健康基准值。

具体的,本实施例中,使用的机器学习算法为贝叶斯超参数优化的XGBoost算法,构建的机器学习模型为XGBoost模型。该系统采用Java语言开发数据接口采集历史运行数据,并负责各模块间的数据通信;历史运行数据来源于实时数据库平台厂级监控信息系统(Supervisory Information System,SIS);采用Python单独安装的极限梯度提升(eXtremeGradient Boosting,XGBoost)包(当前版本1.4.2)实现XGBoost算法算法,该系统支持在浏览器中操作。

一种电厂设备测点健康基准值的预测系统还包括报警模块,报警模块将设备测点的实时数据输入预测模型,得到设备测点的健康基准值,计算测点的实时数据与健康基准值的实时偏差值,在实时偏差值大于预设置的偏差阈值时,标记该时刻,当标记的时刻连续且达到预设置的数量阈值时,发出测点异常报警信号。

在报警模块中,偏差值指的是设备某测点实时运行值与预测模型预测的健康基准值的差值。偏差阈值将对偏差值的上限和下限作约束,设置偏差阈值的作用是监视判断设备的实时运行情况,当测点在某一时刻实时运行值超出偏差阈值时,系统将会对该时刻的点进行标记,需要注意的是,当只有一个或几个点被标记时,系统不会发出报警,这种波动可能是由于信号传输过程中的扰动造成的,而当被标记的点连续且达到一定的数量时,系统才会对该异常测点发出报警信号,工作人员将对这些信号进行进一步处理。

拉直线型数据过滤模块中,基于拉直线变化比率确定阈值范围,若某个时间区间内的测点数据的值在阈值范围内波动,则该时间区间上的数据为拉直线型数据。

判断式配置模块中,启机判断式的构建为:确定设备开机和关机特征变化最显著的测点数据,以测点数据的变化作为设备的启机判断式。

判断式配置模块中,设备运行模式判断式的构建为:对于存在多个运行模式的设备,确定设备不同模式下特征变化最显著的测点数据,,以测点数据的变化作为设备运行模式判断式。

把电厂设备测点的历史健康运行数据按测点名称导入系统,对应各个测点,设置拉直线变化比率、启机判别式与设备运行模式判别式后,即可开始建模,构建机器学习模型并训练,建模完成后可输入实时运行数据查看预测模型计算出来的各个测点的健康基准值。

以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号