首页> 中国专利> 转炉终点磷含量预测模型及构建方法、磷含量预测方法

转炉终点磷含量预测模型及构建方法、磷含量预测方法

摘要

本发明提供了一种转炉终点磷含量预测模型及构建方法、磷含量预测方法,属于冶金控制领域。所述模型构建方法包括:采集相关转炉炼钢的历史数据,对历史数据进行预处理,获得清洁的历史数据;从所述清洁的历史数据中,确定影响终点磷含量的因素,并根据因素值及磷含量真实值构建训练集、测试集和验证集;构建至少两种基于机器学习的转炉终点磷含量预测子模型,采用所述训练集对多个预测子模型进行训练,并基于贝叶斯算法对多个预测子模型的预测结果进行耦合,构建贝叶斯权值网络模型,与多个预测子模型共同构成转炉终点磷含量预测模型。本发明弥补了人工经验以及静态模型在适用性以及命中率的不足,提高了终点磷含量的预测准确度及精度。

著录项

  • 公开/公告号CN114678080A

    专利类型发明专利

  • 公开/公告日2022-06-28

    原文格式PDF

  • 申请/专利权人 北京科技大学;

    申请/专利号CN202210311528.5

  • 发明设计人 冯凯;贺东风;徐安军;

    申请日2022-03-28

  • 分类号G16C20/30;G16C20/70;G06N7/00;G06N20/20;C21C7/064;C21C5/28;

  • 代理机构北京市广友专利事务所有限责任公司;

  • 代理人张仲波

  • 地址 100083 北京市海淀区学院路30号

  • 入库时间 2023-06-19 15:47:50

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-06-28

    公开

    发明专利申请公布

说明书

技术领域

本发明属于冶金控制领域,具体涉及一种转炉终点磷含量预测模型及构建方法、磷含量预测方法。

背景技术

在钢铁冶炼过程中,转炉炼钢是对进入到转炉中的铁水进行脱碳、脱磷,目的是为了能够确保转炉终点钢水的各项成分在合理范围内,其中,转炉终点磷含量是转炉终点参数中相当重要的一项,其关系到了最终生产出的钢产品的性能和洁净度。在转炉脱磷过程中,实时预报并控制最终脱磷转炉终点磷含量,有助于优化炼钢过程中的工艺流程和各项参数的配置。这对于提高钢铁生产的效率以及最终产出的钢铁产品质量起着至关重要的作用。但是,由于转炉炼钢过程本身的动态性和复杂性,实际操作中很难直接用数学的方法对转炉终点磷含量进行准确的描述和求解。

现有技术中,转炉终点磷含量控制主要依靠人工经验和静态模型,然而这些方法自身都存在一定程度上的局限性和不准确性,无法以较高的命中率来预测脱磷转炉终点磷含量。

发明内容

有鉴于此,本发明实施例提供一种获取目标物位置信息的方法、装置及电子设备,提升定位目标物的精度。

为达到上述目的,本发明的实施例采用如下技术方案:

第一方面,本发明实施例提供了一种1、一种转炉终点磷含量预测模型的构建方法,包括如下步骤:

步骤S1,采集相关转炉炼钢的历史数据;

步骤S2,对所述历史数据进行预处理,获得清洁的历史数据;

步骤S3,从所述清洁的历史数据中,确定影响终点磷含量的因素,并根据因素值及磷含量真实值构建训练集、测试集和验证集;

步骤S4,构建至少两种基于机器学习的转炉终点磷含量预测子模型,采用所述训练集和测试集对多个预测子模型进行训练和测试,得到成熟的预测子模型;

步骤S5,将训练集和测试集的因素值分别输入训练完成的多个成熟的预测子模型中,得到多个预测结果;基于贝叶斯算法对多个预测子模型的预测结果进行耦合,构建贝叶斯权值网络模型;多个预测子模型和贝叶斯权值网络模型共同构成转炉终点磷含量预测模型。

上述方案中,所述构建方法还包括:

步骤S6,将验证集输入所述已经训练好的预测子模型及贝叶斯权值网络模型,将预测结果与历史数据中相应的真实值进行对比,计算预测结果的命中率,并根据预测结果的命中率高低,对所述贝叶斯权值网络模型进行再优化。

上述方案中,所述影响终点磷含量的因素,包括:铁水重量、铁水温度、铁水的C、Si、Mn、P含量、转炉加废钢兑铁耗时、冶炼周期、废钢、石灰、白云石、冷却剂。

上述方案中,所述至少两种基于机器学习的转炉终点含量预测子模型,包括但不限于:BP神经网络、案例推理方法、SVM算法、决策树方法中的两种及两种以上。

上述方案中,所述基于贝叶斯算法对多个预测子模型的预测结果进行耦合,构建转炉终点磷含量预测模型,包括:

将预测结果中的转炉终点磷含量划分为N个数值区间,每个区间对应一个类别;

计算出各子模型在某个类别中预测的准确率,根据准确率为每个子模型分配对应的区域权值,将区域权值和预测结果加权求和,得到贝叶斯权值网络模型。

上述方案中,所述构建贝叶斯权值网络模型,具体步骤包括:

在预测结果中取得最小和最大的转炉终点磷含量,规定所要划分的类别个数,对终点磷含量进行区间划分,则每个区间对应着一种转炉终点磷含量类别,如公式(22)所示:

式(212)中,d为每个区间的长度,P

再次将因素值导入预测子模型,得到预测值所对应的类别,将预测值的类别与实际值类别进行比对,计算出d区间长度上每个预测类别出现的概率P(A)以及当预测准确时落在每个预测类别的概率是P(A|准确),如公式(23)和(24)所示:

式(23)中,n

式(24)中,n

计算得到每个子模型的P(A|准确);

根据每个子模型在不同区间上预测的准确率,为每个子模型分配相应的加权值,加权值分配式如下:

式(25)中,w

根据加权值构建贝叶斯权值网络模型,如公式(26)和式(27)所示:

P′

式(26)和(27)中,P

第二方面,本发明实施例还提供了一种转炉终点磷含量预测模型,所述模型由上述的构建方法进行构建。

上述方案中,所述模型包括至少两种由机器学习算法构建并训练完成的转炉终点磷含量预测子模型,和对多个预测子模型的预测结果耦合得到的贝叶斯权值网络模型。

第三方面,本发明实施例还提供节一种转炉终点磷含量预测方法,所述预测方法采用权利要求7或8所述的预测模型进行预测,以实时采集的转炉生产数据中,以所确定的影响终点磷含量的因素相对应的因素值作为模型的输入,输出终点磷含量预测值。

本发明实施例提供的转炉终点磷含量预测模型及构建方法,构建出复合的预测模型,预测脱磷转炉终点磷含量,并根据预测值进行终点磷含量控制,是提高钢铁企业生产效率,以及提高产品质量的重要手段。通过机器学习算法进行建模预测,并用贝叶斯算法耦合提高模型命中率,弥补了人工经验以及静态模型在适用性以及命中率的不足,为今后钢铁企业智能化、绿色化发展提供方法参考。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。

图1为本发明实施例所提供的转炉终点磷含量预测模型的构建方法流程图;

图2为本发明实施例中对多个预测子模型的预测结果进行耦合的流程图。

具体实施方式

本申请发明人在发现上述问题后,对现有的转炉终点磷含量预测方法进行了细致研究。研究发现,伴随着机器学习和人工智能的不断发展和应用,运用机器学习算法来构建转炉终点磷含量预测模型,可以有效地提高磷含量预测的准确度和精度。但是,现有技术中常用的几种预测模型均存在不同程度的局限性,所预测的结果也存在局限性,对工业生产的的指导意义有限。

应注意的是,以上现有技术中的方案所存在的缺陷,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本发明实施例针对上述问题所提出的解决方案,都应该是发明人在本发明过程中对本发明做出的贡献。

下面结合附图对本发明实施例进行详细描述。应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

经过深入研究,本申请实施例提出了一种转炉终点磷含量预测模型及构建方法、磷含量预测方法。由于转炉炼钢的脱磷掺杂着大量影响因素,光凭人工的经验以及静态模型分析很难以较高的命中率预测其终点磷含量。本申请实施例通过四种机器学习算法:BP神经网络、SVM、案例推理方法、决策树,分别建立各个算法的转炉终点磷含量预测模型,并将四种预测模型通过贝叶斯概率计算的方法进行耦合,从而构建精度更高、预测结果更准确的预测模型,以更高精度、更准确的对转炉终点磷含量进行预测。

如图1所示,本发明实施例所提供的转炉终点磷含量预测模型的构建方法,包括如下步骤:

步骤S1,采集相关转炉炼钢的历史数据。

本步骤中,所述数据可以是钢厂或之前研究人员所记录的转炉炼钢数据,至少包括入炉铁水、转炉渣和转炉终点的相关数据。

步骤S2,对所述历史数据进行预处理,获得清洁的历史数据。

本步骤中,对重复和错误数据进行数据清洗,并对数据做统一化处理。现实的转炉炼钢生产过程需要耗费大量的时间,内部变化多且外部噪声大,具有高维性、复杂性,并不是所有的数据都是完整数据,同时在数据格式上也存在多样化,因此获得的原始数据具有多变量、多样本以及多噪声的特点。若直接采用原始数据作为机器学习输入端的样本数据进行建模,将会得到极差的预测模型,影响预测精度,因此在建模前对原始数据进行预处理,减少数据中不必要的干扰,以获得清洁的数据。

所述预处理,包括检查数据一致性、删除无关数据变量、删除空值数据、删除错误数据。其中,数据删除过程,即数据清洗过程。在数据清洗的过程中通常会先检查数据的一致性,检查各个样本数据的每个特征变量是否都在其规定的取值范围内,是否都受既存在的相互关系约束;若发现其有形式上或逻辑上的错误,应当给出相应的纠正或者将改样本数据删除。由于在实际生产中记录的数据常常会伴有很多对分析无用信息以及记录出错的情况,因此,对数据进行数据清洗,即对数据进行再次整理和再次的校对,对样本数据中存在的无效数据、错误数据、空值进行删除,保留可能有效的特征值,尽可能降低模型输入端数据的噪声。

本实施例选取某炼钢厂2016年1月份至9月份的脱磷转炉生产记录数据为例进行说明。由于场内制度规定,原始的生产数据中记录了许多与本实施例方案无关的样本特征值,例如生产日期、生产班组、炉次号、炉龄等,如表1所示。因此按照数据清洗的规则,对这类无效特征值进行删除处理,删除方法采用整列特征删除。

表1

除了无效值外,原始数据中还存在很多由于探测技术限制,而无法准确测量的元素含量值如:Ni、Cr、Cu、Mo、V等,这些特征值的样本数据在原始数据表中呈现为空值,因此也采取整列特征删除的方法进行数据清洗。

步骤S3,从所述清洁的历史数据中,确定影响终点磷含量的因素,并根据因素值及磷含量真实值构建训练集、测试集和验证集。

本步骤中,分析影响转炉脱磷过程各因素之间存在的联系,利用采集得来的数据进行统计分析,将不同的终点磷含量情况进行一个大致分类。从历史数据中选取影响终点磷含量的因素值,作为预测子模型及预测模型的训练值;同时将相对应的真实值作为计算命中率的标准值。本实施例中,根据经验及相关参数,选取以下12个特征值作为影响终点磷含量的因素,作为模型的数据输入,其中12个特征值分别为:铁水重量、铁水温度、铁水的C、Si、Mn、P含量、转炉加废钢兑铁耗时、冶炼周期、废钢、石灰、白云石、冷却剂。

将历史数据中每个样本的12个特征值及相应的终点磷含量真实值作为一组数据,选取若干组数据作为模型构建的训练集,其余再分为测试集和验证集。

步骤S4,构建至少两种基于机器学习的转炉终点磷含量预测子模型,采用所述训练集和测试集对多个预测子模型进行训练和测试,得到成熟的预测子模型。

本步骤中,所述至少两种基于机器学习的转炉终点含量预测子模型,包括但不限于:BP神经网络、案例推理方法、SVM算法、决策树方法中的两种及两种以上,还可以包括其他可用于终点含磷量预测的机器学习算法,如K近邻算法等。下面以BP神经网络、案例推理方法、SVM算法、决策树方法四种算法为例,说明一下构建基于机器学习的转炉终点磷含量预测子模型、并采用训练集对多个预测子模型进行训练的过程。

其中,采用BP神经网络构建转炉终点磷含量预测子模型过程如下:

构建用于转炉终点磷含量预测的BP神经网络,所构建的网络结构包括四层,分别为:输入节点层、隐藏节点层、激活层和输出节点层。所构建的基于BP神经网络的转炉终点磷含量预测子模型的模型参数包括学习率、激活函数、隐层节点个数及误差函数。

其中,所述学习率η指的是每次误差逆反馈时权值修改的大小。在训练过程中需要调整η取合理的值,若η过大会导致系统震荡,η过小则会导致网络收敛速度过慢,一般η取值在0.01~0.8之间。

所述激活函数本身是一个非线性函数,因此透过激活函数可以让网络拥有处理非线性数据的能力,选自以下三种激活函数,分别是:Sigmoid函数、ReLU函数以及tanh函数。

Sigmoid函数公式为:

ReLU函数公式为:

R(x)=max(0,x) (2)

tanh函数公式为:

所述隐层节点个数可以通过以下三种方式进行设定:经验法、枚举法以及人工设置法。

经验法公式如下:

式(4)中,m是输入节点个数,n是输出节点个数。

枚举法即枚举不同隐层节点个数来建立模型,并以误差最小的模型的隐层节点为最终确定的节点个数。

所述误差函数通过研究预测值与真实值的均方误差来作为判断模型精度的依据,计算公式如下:

式中,Ti为实际值,Yi为预测值。

参数确定后,通过训练集对模型进行训练。训练前,对训练集数据进行归一化处理。输入节点要输入的数据包括铁水重量、铁水温度、铁水的C、Si、Mn、P含量、转炉加废钢兑铁耗时、冶炼周期、废钢、石灰、白云石、冷却剂。由于这些变量的量纲各不相同,且输入数值越大,产生的误差越大,所以需要对导入的数据进行归一化处理。在后期模型优化调参时将会相应删去影响权值较小的特征。所述归一化处理可以采用两种方式进行,分别是:[0,1]标准化和[1,1]标准化。其中,采用[0,1]标准化进行归一化处理,公式如下:

采用[1,1]标准化进行归一化处理,公式如下:

公式(6)和(7)中,X*表示归一化后的数值,X表示归一化前数值,X

所述基于BP神经网络的转炉终点磷含量预测子模型,训练过程包括:首先,确定BP神经网络的输入向量和输出目标,导入训练集数据后,对数据进行归一化处理;然后,设计神经网络的训练参数,并采用误差逆传播算法进行迭代训练;最后,达到设定迭代次数后,完成模型训练,并保存神经网络节点参数。

采用SVM算法构建转炉终点磷含量预测子模型过程如下:

建立要输入的数据样本空间,形成训练样本集;

数据归一化处理;

选择合适的核函数以及其相关参数;

通过核映射方式将样本空间映射到更高维的特征空间中,并在该空间下寻找相应的最优分类超平面;

输入测试样本集,计算其f(x)=w

分析分类误差,调整核函数以及参数以获得更高的分类准确度。

其中,输入特征和输出特征的选取时,建立SVM模型所使用的输入特征同样是经过数据清洗过的样本特征数据,如上所述优选为12个特征向量,分别为:铁水重量、铁水温度、铁水的C、Si、Mn、P含量、转炉加废钢兑铁耗时、冶炼周期、废钢、石灰、白云石、冷却剂。模型的输出数据是待预测的转炉终点磷含量,在后期模型优化调参时将会删去一些影响权值较小的输入特征。

对训练集中的输入数据进行归一化,也包括[0,1]标准化和[1,1]标准化两种归一化方式,其基本公式与BP神经网络下的归一化方式相同。

所构建的SVM模型结构,在进行核函数的选择时,由于实际生活中的样本特征和样本类别并不会只有单纯的二维和两类,所以当对有着多维特征的样本数据进行寻找其最优分类平面时,就需要先对输入的数据进行非线性变换把这些数据特征转化到一个高维特征空间,接着在这个高维的特征空间内寻找到能够分割数据类别的最优分类平面,而这种将输入空间向高维度转换的过程需要借助核函数来实现。本实施例中,输入数据的各特征值并不是呈线性关系,因此需要引入核函数来将特征映射至高维特种空间从而实现可分。以三种不同的SVM核函数为例进行说明,分别为高斯核函数、线性核函数和多项式核函数。

高斯核函数:

式(8)中(x,x

线性核函数:

K(x,x

多项式核函数:

K(x,x

式(10)中,q由用户决定的参数,此时获得一个q阶多项分类器。

本实施例中以高斯核函数为例进行说明。

本实施例中SVM模型引入了松弛变量,由于在现实任务中,很难能找到一个超平面来让每一类的样本都分开,转炉炼钢过程更是如此,在转炉炼钢过程中有大量的外界因素参与影响,导致其特征维度相当之大。所以需要引入松弛变量,引入松弛变量的意义就是允许一些样本分类出错,但又希望分类的样本越少越好,所以松弛变量的大小也需要一定限制。引入松弛变量后,间隔问题变成了软间隔问题。松弛变量的约束条件为:

y

式(11)和(12)中,w和b为要求解的超平面f(x)=w

所述惩罚因子C的设定对最终拟合函数的分类精度有着一定影响,设定惩罚因子即是对错误分类进行一定的惩罚。当惩罚因子越大,SVM模型在为样本分类时越害怕分错,因此容易出现过拟合现象。惩罚因子越小,SVM模型在为样本分类是越不精确,因此容易出现欠拟合。

高斯核函数内部有一个参数σ需要设定。σ表示核宽度系数,该参数代表着某点的支持向量与周围其他支持向量的关联度,系数越小,该点支持向量越不容易受其他支持向量影响,但过小的核宽度系数会导致过拟合现象。

所述案例推理方法是一种基于过往历史案例,建立起案例数据库,当出现问题案例时,根据其所记录的相关的变量,通过一定的相似度计算方法检索案例库中与问题案例相似度较高的几个案例,并对这些相似度高的历史案例的结果进行相应的修正,以获得当前问题案例的问题解,并将问题案例存储到案例库中进行学习。

采用案例推理方法构建转炉终点磷含量预测子模型过程如下:

案例表示:对历史案例和出现的新案例进行分析以及特定表示,提取出案例中的关键特征变量,根据一定的表达方式将其表达为同一种案例形式。所述历史案例和出现的新案例来自于案例库,所述案例库由训练集数据组成,一般来说,每一条数据可以视为一个案例。

案例检索:通过一定的相似度计算公式,将出现的问题案例与案例库中的历史案例进行相似度的匹配计算,从最终结果中挑选出几个相似度高的历史案例。最终筛选出几个最佳的相似案例提供给用户作为参考。

案例重用:将筛选出来的高相似度的历史案例与问题案例作比较,取其中适合于问题案例情况的部分作为重用部分,来为问题案例建立解决方案。

案例修正:以筛选出的相似案例为基础,根据问题案例的实际特征变量情况进行调整和修改,目的是为了得到最适合且最贴近准确答案的解决方案。

案例存储:将问题案例以及通过案例推理得到的解决方案作为新的案例样本存储入案例库中,从而进一步完善案例库。

其中,所述案例表示,通过案例的属性特征表示,具体包括:从进行过数据清洗的训练数据集中提取每个案例的属性特征,用这些特征值来表示案例,即Case={特征属性值1,特征属性值2……特征属性值n}。选取12个案例特征来描述,分别为:铁水重量、铁水温度、铁水的C、Si、Mn、P含量、转炉加废钢兑铁耗时、冶炼周期、废钢、石灰、白云石、冷却剂。但在后期优化时将会删去一些影响权值较小的特征。

同理,本步骤中也需要对数据进行归一化处理,可以采用公式(6)和(7)所示的[0,1]标准化和[1,1]标准化。

所述案例检索之前,需要为每个特征确定相应的权重,包括两种权重计算方式,分别为均权法和熵权法。均权法即分配相等的权值给每个特征属性。熵权法计算公式如下式(13)至式(16)所示。首先计算第j个特征的信息熵:

其中,H

则第j项特征的权值为:

式(16)中,W

所述案例重用时,需要进行相似度计算。相似度计算是计算问题案例和历史案例的相似度,通过二者的相似度大小选择合适的历史案例进行案例重用。在本次试验中,有两种方式计算相似度,分别是欧里几何相似度计算和灰色相似度计算。计算欧里几何相似度:假设待研究的案例的特征有m个,在案例库中案例的第i个特征为X

则问题案例与库中案例相似度为:

计算灰色相似度:

在式中,ξ(k)表示在k时刻x

在执行案例重用时,采用的案例重用方式为取前n个与问题案例相似度最大的历史案例,将这些案例的转炉终点磷含量去均值,获得的就是问题案例转炉终点磷含量的预测值。计算公式如式(20):

式(20)中,P

采用决策树方法构建转炉终点磷含量预测子模型过程如下:

输入样本特征值并确定数据类型:通过对初试数据进行预处理后,共选取了12个特征进行建模,其中模型的输出为转炉终点磷含量。12个建模特征分别为:铁水重量、铁水温度、铁水的C、Si、Mn、P含量、转炉加废钢兑铁耗时、冶炼周期、废钢、石灰、白云石、冷却剂。这些特征值都是连续类型变量,因此都需要通过C4.5算法对这些连续类型的变量进行离散化处理,并且后续的参数优化还会进一步筛选特征。

初始化决策树结构,设置参数:根据所得到的输入特征,可以设定好决策树模型子节点所代表变量集合。由于最终的输出变量也是连续类型,因此需要人为的为输出变量进行分类。每个类别的区间长度为:

式中,P

设定C4.5算法的参数:本研究中C4.5算法主要有两个参数,分别为决策树最大高度以及能进入决策树的最大节点个数。

决策树误差公式:由于决策树最终输出的是预测样本的类别标签,而不是连续的预测值,因此需要人工地将标签与具体预测值对应起来。取每个类别区间地均值作为被分配到该类别的样本预测值。误差的分析仍然采用预测值和实际值的均方误差作为依据进行。

决策树学习算法是一种在特征空间中不断分割样本数据的算法,其目的在于通过学习过往案例数据推理和归纳出树形结构的案例表现图。决策树算法最终训练形成的就是一个树形结构分类器,这个分类器包括从根节点到所有叶子节点的所有节点。决策树上的每一个节点代表着样本的某一个特征值的特定取值,当一个新样本数据进入根节点后,会依次经过各个子节点的测验,通过测验结果来选择进入的下一个子结点,知道遍历到叶子节点,树上的叶子节点便代表这样本的一种类别,当问题样本到达叶子结点时,其分类过程也随之完成。例如,以一棵简单的决策树为例,在树中A、B、C各表示样本数据的一个特征集合,a1、a2、b1、b2、c1、c2表示对应特征的特定取值,只有满足该取值条件才会沿着该路径前往下个节点。1、2、3、4四个叶子节点表示样本的四种类别。从这棵决策树可以看出决策树的训练方式简单,模型结构直观明了。

本实施例中训练决策树采用的C4.5算法是由ID3算法改进而来的。相对于ID3,C4.5算法不但拥有了处理连续值属性的能力,而且在分裂属性的标准上采用了计算信息增益率的方法;这使其在数据预处理时,能够把连续值合并处理;在建树的过程中,可以容忍一定的属性值缺失;在树进行修剪时,会采用不同的修剪算法来避免过度拟合问题。

上述仅举例说明了所采用的四种机器学习算法来构建预测子模型,在实际操作中,可以根据各机器学习算法对子模型进行优化和改进,同时,也可以采用其他适用的机器学习算法进行子模型的构建、训练和测试,如KNN算法等。

步骤S5,将训练集和测试集的数据分别输入训练完成的多个成熟的预测子模型中,得到多个预测结果;基于贝叶斯算法对多个预测子模型的预测结果进行耦合,构建贝叶斯权值网络模型;多个预测子模型和贝叶斯权值网络模型共同构成转炉终点磷含量预测模型。

本步骤中,基于上述构建并训练完成的多个预测子模型,再采用贝叶斯算法对结果进行耦合,从而得到最终的磷含量预测结果。如图2所示,所述基于贝叶斯算法对多个预测子模型的预测结果进行耦合,构建构建贝叶斯权值网络模型,具体包括:

将预测结果中的转炉终点磷含量划分为N个数值区间,每个区间对应一个类别;计算出各子模型在某个类别中预测的准确率,根据准确率为每个子模型分配对应的区域权值,将区域权值和预测结果加权求和,得到贝叶斯权值网络模型。计算出上述各个预测子模型在某个类别中预测准确的概率,根据其准确率为每个算法分配对应的区域权值,最后输出这些加权预测值的和,就得到了贝叶斯网络的预测值。

如图2所示,所述构建贝叶斯权值网络模型具体步骤包括:

将训练集和测试集中的因素值导入预测子模型中获得预测值,分别比较不同子模型预测值与实际值的误差,当小于误差时认为本次预测准确,从而计算出每个子模型的准确度,记为P(准确)。

由于所预测的转炉终点磷含量是连续值,很难做到有限分类,于是将其转为离散值,在训练数据中取得最小和最大的转炉终点磷含量,规定所要划分的类别个数N,对其进行区间划分,则每个区间对应着一种转炉终点磷含量类别,即对所获得的终点磷含量数据进行区间分类,每个区间为一类,一共N类,如公式(22)所示:

式(22)中,d为每个区间的长度,P

再次将因素值导入预测子模型,得到预测值所对应的类别,将预测值的类别与实际值类别进行比对,便可以计算出每个预测类别出现的概率P(A)以及当预测准确是落在每个类别的概率是P(A|准确),如公式(23)和(24)所示:

式(23)中,n

式(24)中,n

对每个子模型都进行上述步骤,再计算得到每个子模型的P(A|准确),即每个算法在预测值落在区间A时,预测准确的概率。

根据每个子模型在不同区间上预测准确的准确度,可以为其分配相应的加权值,加权值分配式如下:

式(25)中,w

通过以上步骤,贝叶斯权值网络模型建立完成,公式如式(26)和式(27)所示:

P′

式(26)和(27)中,P

步骤S4中所得到的多个预测子模型和本步骤中的贝叶斯权值网络模型共同构成转炉终点磷含量预测模型。

将待测数据导入预测子模型,计算出每个算法对应的预测值P

基于上述方案构建出转炉终点磷含量预测模型,并采用上述模型进行实际预测,基于BP神经网络、SVM、案例推理、决策树这四种机器学习算法,进行脱磷转炉终点磷含量的预测,当可容忍误差在0.0105时,命中率分别为80.29%、78.38%、76.78%、77.08%;用贝叶斯将上述预测子模型的预测结果进行耦合,进行脱磷转炉终点磷含量的预测,当可容忍误差在0.0105时,模型命中率为80.6%,该命中率相比耦合前的各个预测模型都有提高,结果表明通过贝叶斯耦合方法可以获得更高精度的预测模型,帮助预测转炉终点磷含量,从而进行转炉终点控制。

由以上技术方案可以看出,本发明实施例所提供的转炉终点磷含量预测模型的构建方法,构建出复合的预测模型,预测脱磷转炉终点磷含量,并根据预测值进行终点磷含量控制,是提高钢铁企业生产效率,以及提高产品质量的重要手段。通过机器学习算法进行建模预测,并用贝叶斯算法耦合提高模型命中率,弥补了人工经验以及静态模型在适用性以及命中率的不足,为今后钢铁企业智能化、绿色化发展提供方法参考。

基于上述转炉终点磷含量预测模型的构建方法,本发明实施例还提供了一种转炉终点磷含量预测模型,所述模型通过上述转炉终点磷含量预测模型的构建方法得出构建,包括至少两种由机器学习算法构建并训练完成的转炉终点磷含量预测子模型,和对预测子模型的预测结果耦合得到的贝叶斯权值网络模型。

同时,本发明实施例还提供了一种转炉终点磷含量预测方法,所述预测方法基于所构建的预测模型,对当前转炉的终点磷含量进行预测,预测时以转炉的实时数据中影响终点磷含量的因素值为输入,输出终点的磷含量预测值,对预测结果准确且精度高,充分满足了当前转炉生产的需要。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号