首页> 中国专利> 基于改进神经网络的多牌号C-Mn钢力学性能预测方法

基于改进神经网络的多牌号C-Mn钢力学性能预测方法

摘要

本发明提供一种基于改进神经网络的多牌号C‑Mn钢力学性能预测方法,首先采集多牌号C‑Mn钢在热连轧生产过程中的生产数据并进行数据处理,然后采用前向选择的相关性分析方法生成各力学性能的样本集,采用PSO算法对BRNN网络模型训练过程中的参数进行优化,通过选取多个牌号的C‑Mn钢生产数据,使数据样本中包含了更加全面的生产工艺信息,解决了单钢种生产工艺的数据无法包括全面的工艺信息的问题;通过采用数据处理和相关性分析方法,使数据更加稳定且更具规律性,并可以有效简化预测模型的结构;通过引入PSO算法对BRNN模型进行改进,解决了其存在的容易陷入局部最小值的问题,经过改进的神经网络具有良好的泛化能力,能够更客观地符合物理冶金学规律。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-09-15

    授权

    发明专利权授予

说明书

技术领域

本发明属于钢铁工业生产和数据统计建模的交叉技术领域,特别涉及一种基于改进神经网络的多牌号C-Mn钢力学性能预测方法。

背景技术

近年来,随着计算机技术的快速发展以及分布式控制系统在钢铁行业中的广泛应用,钢铁生产过程中产生的大量数据被采集并存储下来,这些数据综合反映了钢铁生产过程中各环节之间的内在联系,具有巨大的应用价值。但如何从这些大量的数据中挖掘出有用的信息以实现产品性能的精准预测以及稳定性控制,一直没有很好的解决。人工智能技术的兴起为工业数据挖掘提供了新的思路,利用人工智能技术实现热轧产品力学性能预测以及控制已经成为当前研究的热点。

其中,采用人工神经网络(Artificial Neural Networks,ANN)建立热轧带钢力学性能预测模型是当前常用的一种方法。但目前,现有技术中钢铁生产数据建模主要是采用单钢种进行建模,由于单钢种生产工艺的单一性,导致数据分布集中于轧钢工艺的设定目标值。这样选取的数据无法包括全面的工艺信息,导致模型适用性差;而且由于实际工业数据不可避免的存在数据冗余、异常值以及分布不均衡的问题,如果基于未经处理的数据建立预测模型,所建模型的预测精度难以达到理想状态;此外,钢铁生产数据建模多基于贝叶斯正则化方法的神经网络(Byesian Regularization Neural Networks,BRNN),BRNN模型在训练时采用Levenberg-Marguardt算法进行权值、阈值的更新优化,其在进行参数寻优时容易陷入局部最小点,导致算法最终寻找的参数往往不是最优参数,故模型的精度有待提高。

发明内容

针对现有技术的不足,本发明提出一种基于改进神经网络的多牌号C-Mn钢力学性能预测方法,该方法采集多牌号C-Mn钢在热连轧生产过程中的生产数据并进行数据处理,利用前向选择法选取出与力学性能相关性较高的参数构成数据集,并且引入粒子群算法(Partical Swarm Optimization,PSO)对BRNN模型进行改进,最终基于改进的神经网络建立了多牌号C-Mn钢的力学性能预测模型,达到热轧带钢力学性能高精度预测的目的。

一种基于改进神经网络的多牌号C-Mn钢力学性能预测方法,包括:

步骤1:采集多个牌号的C-Mn钢在热连轧生产过程中的生产数据;

步骤2:对采集到的生产数据进行数据处理;

步骤3:对于处理后的数据采用前向选择的相关性分析方法,筛选出与各力学性能相关性较高的前N个特征参数,将前N个特征参数对应的数据作为相应力学性能的样本集,所述力学性能包括屈服强度YS、抗拉强度TS和伸长率EL;

步骤4:将各力学性能的样本集划分为训练集和测试集,利用训练集对BRNN网络进行训练,训练过程中采用PSO算法对BRNN网络模型的权值和阈值进行优化,利用测试集对模型进行测试,得到每个力学性能对应的参数最优BRNN网络模型;

步骤5:利用参数最优BRNN网络模型对C-Mn钢的力学性能进行预测。

所述步骤2中数据处理包括:填充空缺值、层次聚类、异常值剔除、数据归一化处理以及数据均衡化处理。

所述步骤4包括:

步骤4.1:初始化PSO算法的参数;

步骤4.2:基于PSO算法利用训练集求解出最优权值和阈值,并赋值给BRNN网络模型,完成PSO优化过程。

所述步骤4.2包括:

步骤4.2.1:确定BRNN模型的网络结构,设置BRNN模型的隐藏层个数、隐藏层神经元个数以及超参数α与β;

步骤4.2.2:计算PSO算法中粒子维度p,根据BRNN模型的网络结构确定PSO算法中每个粒子的维度p,粒子维度p等于BRNN模型中所有权值和阈值数量的总和,即

p=(d+l'+1)q+l'

式中,d为输入层神经元个数,q为隐藏层神经元个数,l'为输出层神经元个数;

步骤4.2.3:随机产生一个包含S'个粒子的初始种群;

步骤4.2.4:计算各粒子的适应度函数值F(J),根据各粒子的适应度函数值,更新粒子个体最优位置p

式中,M

步骤4.2.5:判断全局最优位置g

步骤4.2.6:将全局最优位置g

步骤4.2.7:得到权值和阈值最优的BRNN模型后,利用测试集对模型进行测试,完成PSO优化过程。

本发明的有益效果是:

本发明提出了一种基于改进神经网络的多牌号C-Mn钢力学性能预测方法,构建训练样本集时选取多个牌号的C-Mn钢生产数据,使数据样本中包含了更加全面的生产工艺信息,解决了单钢种的生产工艺数据无法包括全面工艺信息的问题,有效提高了所建模型的适用性;采用填充空缺值、层次聚类、异常值剔除、数据归一化处理和数据均衡化处理的数据处理手段以及基于前向选择的相关性分析方法构建各力学性能的数据集,解决了实际工业数据存在数据冗余、异常值以及分布不均衡的问题,使数据更加稳定且呈现出合理的规律性,并且在保证模型精度的前提下有效简化了模型结构;引入粒子群算法对基于贝叶斯正则化方法的神经网络进行改进,解决了基于贝叶斯正则化方法的神经网络存在的容易陷入局部最小值的问题,并且经过改进的神经网络模型具有良好的泛化能力,能够反映出符合物理冶金学的规律。

附图说明

图1为本发明中基于改进神经网络的多牌号C-Mn钢力学性能预测方法流程图;

图2为本发明中生产数据处理流程图;

图3为本发明中前向选择流程图;

图4为本发明中前向选择中R

图5为本发明中利用PSO优化BRNN模型的流程图;

图6为本发明中PSO算法粒子移动位置示意图;

图7为本发明中BRNN模型隐藏层节点数搜索曲线图,其中(a)表示屈服强度对应的BRNN模型的隐藏层节点数搜索曲线图,(b)表示抗拉强度对应的BRNN模型的隐藏层节点数搜索曲线图,(c)表示伸长率对应的BRNN模型的隐藏层节点数搜索曲线图;

图8为本发明中BRNN和PSO-BRNN两种模型的R

图9为本发明中BRNN和PSO-BRNN两种模型在测试数据上的误差分布,其中,(a)是两种模型对屈服强度测试的误差分布;(b)是两种模型对抗拉强度测试的误差分布;(c)是两种模型对伸长率测试的误差分布。

具体实施方式

下面结合附图和具体实施实例对发明做进一步说明。

如图1所示,一种基于改进神经网络的多牌号C-Mn钢力学性能预测方法,包括:

步骤1:采集多个牌号的C-Mn钢在热连轧生产过程中一定时间段内的生产数据,所有生产数据构成一个二维数据集,同一钢卷号对应一组生产数据,每组生产数据中包含影响C-Mn钢力学性能的各参数,所述力学性能包括屈服强度YS、抗拉强度TS和伸长率EL;

对于热轧C-Mn钢来说,化学成分、工艺参数是直接影响力学性能的关键因素,此外还有外界环境、工况等也将对性能产生影响。本实施例中选择的影响C-Mn钢力学性能的生产数据一方面来自于C-Mn钢本身的各化学成分质量所占百分比,另一方面来自于C-Mn钢在热连轧生产过程中的工艺参数,其中化学成分包括碳C、硅Si、锰Mn、磷P、硫S、镍Ni、铬Cr、铜Cu、铝Al、铌Nb、钒V、钛Ti、氮N,工艺参数包括粗轧出口厚度(Rougth Delivery Height,RDH)、粗轧出口温度(Rougth Delivery Temperature,RDT)、精轧出口厚度(FinishDelivery Height,FDH)、精轧出口温度(Finish Delivery Temperature,FDT)、卷取温度(Coiling temperature,CT)、出炉温度(Soaking Re-furnace Temperature,SRT)、热卷箱内保温时间(t)、精轧后3机架的压下率(ε)、层流冷却平均冷速(Cooling Rate,CR)、冷却开始温度(Cooling Starting Temperature,CST)、冷却结束温度(Cooling EndingTemperature,CET)、轧辊辊径以及各道次的轧制力。

步骤2:对采集到的生产数据进行数据处理,所述数据处理包括填充空缺值、层次聚类、异常值剔除、数据归一化处理以及数据均衡化处理,处理过程如图2所示;

步骤2.1:填充空缺值,根据物理冶金原理确定出影响C-Mn钢力学性能的关键参数和非关键参数,得到影响C-Mn钢力学性能的关键参数,对于关键参数缺失的钢卷则直接剔除整卷钢卷对应的一组生产数据,除关键参数之外的生产数据则为非关键参数,对于非关键参数缺失的钢卷采用相邻两组样本数据中该参数的均值替代,所述关键参数包括碳C质量分数、硅Si质量分数、锰Mn质量分数、磷P质量分数、硫S质量分数、铌Nb质量分数、钛Ti质量分数、C-Mn钢在粗轧出口处的厚度和温度、C-Mn钢在精轧出口处的厚度和温度、C-Mn钢卷取时的温度、C-Mn钢在出炉口处的温度、C-Mn钢在热卷箱内保温的时间、精轧后3机架的压下率、层流冷却平均冷速、冷却开始温度以及冷却结束温度;所述非关键参数包括辊径、各道次轧制力、镍Ni质量分数、铬Cr质量分数、铜Cu质量分数、铝Al质量分数、钒V质量分数、氮N质量分数;

步骤2.2:层次聚类,针对钢铁工业大数据中的异常值和数据冗余问题,填充空缺值后的数据采用基于马氏距离的层次聚类方法对数据进行归纳分类,基于马氏距离的层次聚类是一种自下而上的分类过程,首先将各类参数中的每个样本数据当做一个初始的聚类簇,然后通过计算每两个聚类簇之间的马氏距离找到距离最近的两个聚类簇进行合并,从而实现数据的分类。马氏距离d

式中,x为两个对象的差值矩阵;

通过选择合适的聚类簇个数,本实例中预设的聚类簇个数为1000,可将样本数据集划分成不同的聚类簇,实现数据的分类。结合轧制工艺理论,当同一聚类簇中的关键成分、工艺参数相同或相近时,可认为是同一轧制规程生产的数据,从而实现统计学理论和轧制理论的结合。

步骤2.3:异常值剔除,在层次聚类的基础上,根据同一聚类簇中钢卷的个数选择不同的异常值剔除准则,即当聚类簇中样本数大于阈值30时,采用3σ准则剔除聚类簇中的异常值,否则,采用格拉布斯准则进行异常值剔除。在异常值剔除的基础上,同一聚类簇中的钢卷数据反映的信息认为是相同或相似,故在异常值剔除后,对同一聚类簇下各影响参数内的数据分别求和取均值,即同一聚类簇内所有影响参数的均值构成一组新的数据。

步骤2.4:数据归一化处理,设异常值剔除后的某类参数下的所有数据为X

式中,m为数据总个数,X

步骤2.5:数据均衡化处理,数据分布的离散性使得模型在学习过程中容易忽略掉部分信息,采用数据均衡化处理可解决此问题,具体步

式中,μ

表1示出了数据处理前后各参数的数据特征。可以看出,经过数据处理后,大部分参数标准差减小,数据更加稳定且数据在数量上有了较大的精简,其中YS表示屈服强度,TS表示抗拉强度,EL表示伸长率,w[C]表示碳的质量分数,w[Si]表示硅的质量分数,w[Mn]表示锰的质量分数,w[P]表示磷的质量分数,w[S]表示硫的质量分数,w[Si]表示硅的质量分数;

表1 C-Mn钢数据处理结果

步骤3:对于处理后的数据采用前向选择的相关性分析方法,筛选出与各力学性能相关性较高的前N个特征参数,将前N个特征参数对应的数据作为相应力学性能的样本集;

前向选择法(Forward Selection,FS)是当前常用的一种相关性分析方法,可从众多相关参数中筛选出与目标参数相关性最高的参数组合,其流程如图3所示。FS方法通过建立单个参数和目标参数之间的线性相关模型,根据回归模型的模型确定性系数R

(1)建立各参数和目标参数的回归模型

设模型输入参数为x,输出参数为y,其中输入参数x中包含n’个参数,则x和y之间线性回归模型可表示为:y=f(x

(2)确定FS的首个特征x

根据输入参数和输出参数之间的回归模型,计算出各参数对应的模型的R

(3)提取新的多元特征集,构建多元线性回归模型

将已确定的特征输入参数x

以屈服强度为例进行前向选择。首先根据所有钢卷的屈服强度值与任意参数下的所有数据构建该参数与屈服强度之间的线性回归模型,求解出各参数分别与屈服强度之间的线性回归模型后,计算出每个线性回归模型对应的模型确定性系数R

在FDH的基础上,继续添加其他影响因子,将FDH与其他各参数分别进行组合,计算屈服强度与各组合之间的二元回归模型,得到卷取温度CT与FDH的组合构建出的二元回归模型的R

表2前向选择过程中计算得到的R

图4示出了屈服强度、抗拉强度以及伸长率前向选择过程中R

表3 FS所筛选的参数

基于贝叶斯正则化方法的神经网络通过在网络训练目标函数中引入代表网络结构复杂程度的约束项,从而可以保证模型在训练过程中不仅仅考虑到预测值和实测值之间的误差,同时也能够考虑到网络结构的复杂程度带来的影响,因而可有效地防止过拟合。

BRNN预测模型训练时采用的是Levenberg-Marguardt算法,此类算法通常从某初始解出发,根据负梯度方法迭代寻找最优参数值,在每次迭代过程中,通过计算当前点的梯度,根据梯度正负确定下一步的搜索方向。当前参数如果使得目标函数的梯度为0时,说明函数已达到局部最优点,迭代将停止,最优参数也随之确定。如果目标函数只有一个局部最优点,则该点就是全局最优点,然而,当目标函数存在多个局部最优点时,将不能保证寻找到的局部最优点就是全局最优点。此时,利用神经网络构建各力学性能的BRNN预测模型,其预测精度有待提高。为此,采用PSO算法(即粒子群算法)对BRNN网络参数进行优化,以寻找出最优网络参数,防止模型训练陷入局部最优解,从而提高模型预测精度。

PSO算法是通过模拟鸟群捕食行为而提出的一种智能优化算法,其核心思想是:每个粒子通过向个体最优和群体最优学习,不断调整自己的速度和位置,从而搜索到全局最优解,粒子移动轨迹如图6所示。故本实例利用PSO搜索BRNN模型的权值w、阈值b以改善BRNN预测模型的精度。

设由权值、阈值构成的目标优化问题的解是p维向量,根据PSO算法,在参数空间中随机分布S'个粒子,每个粒子包括p个属性,其中粒子数称为种群规模Sizepop(一般取值为20~40),其位置为x

x

式中,c

惯性权重w表示当前粒子的运动惯性,w值越大,粒子的空间搜索能力越强,PSO算法的全局搜索能力增强;w值越小,粒子对下代粒子的影响越小,越有利于PSO算法的局部搜索。在此,采用下式对w值进行合理选择,保证PSO算法有全局搜索能力的同时可快速局部搜索到全局最小点。

式中,w(τ)表示第τ次迭代时的惯性权重,w

步骤4:将各力学性能的样本集划分为训练集和测试集,利用训练集对BRNN网络进行训练,训练过程中采用PSO算法对BRNN网络模型的权值和阈值进行优化,利用测试集对模型进行测试,得到每个力学性能对应的参数最优BRNN网络模型,利用PSO算法对BRNN模型进行参数优化的流程图如图5所示,得到的模型简称PSO-BRNN模型;包括:

步骤4.1:初始化PSO算法的参数;

在利用PSO算法对BRNN进行参数寻优时,首先需要确定PSO算法中的参数,这些参数的取值将影响到粒子的行动速度、探索能力,针对不同的力学性能预测模型,PSO算法的参数值如表4所示。

表4 PSO参数值

步骤4.2:基于PSO算法利用训练集求解出最优权值和阈值,并赋值给BRNN网络模型,完成PSO优化过程;包括:

步骤4.2.1:确定BRNN模型的网络结构,设置BRNN模型的隐藏层个数、隐藏层神经元个数以及超参数α与β;

这里设置超参数α=0、β=1,隐藏层个数为1,最优的隐藏层神经元个数由人工试凑法确定。以训练数据实测值和预测值的均方误差(MSE)作为模型精度度量标准,将相同的数据集分别输入含有1~18个隐藏层神经元的BRNN模型,其中获得最低MSE的BRNN模型效果最好,其隐藏层神经元个数即为最优的隐藏层神将元个数。屈服强度、抗拉强度和伸长率预测模型不同隐藏层神经元个数与MSE的关系如图7所示。从图7中可以看出:屈服强度对应的BRNN模型的隐藏层神经元个数应该设置为9;抗拉强度对应的BRNN模型的隐藏层神经元个数应该设置为8;伸长率对应的BRNN模型的隐藏层神经元个数应该设置为8。

步骤4.2.2:计算PSO算法中粒子维度p,根据BRNN模型的网络结构确定PSO算法中每个粒子的维度p,粒子维度p等于BRNN模型中所有权值和阈值数量的总和,即

p=(d+l'+1)q+l'                          (7)

式中,d为输入层神经元个数,q为隐藏层神经元个数,l'为输出层神经元个数;

步骤4.2.3:随机产生一个包含S'个粒子的初始种群,第s个粒子的速度为v

式中,v

步骤4.2.4:计算各粒子的适应度函数值,寻找当前粒子的个体最优与全局最优。选择训练集实测值和预测值之间的均方根误差(RMSE)作为适应度函数值F(J),F(J)如式(8)所示。首先将各粒子的初始位置x

式中,M

步骤4.2.5:判断全局最优位置g

步骤4.2.6:将全局最优位置g

步骤4.2.7:得到权值和阈值最优的BRNN模型后,利用测试集对模型进行测试,完成PSO优化过程。

步骤5:利用参数最优BRNN网络模型对C-Mn钢的力学性能进行预测。

为保证结果的可比性,利用相同数据集中的数据作为对比实验的实验数据,以样本数据实测值和预测值的均方根误差(RMSE)和平均相对误差(AARE)作为模型精度的衡量指标。对比实验中的两个对比模型设置如下:(1)本发明提出的利用PSO算法优化BRNN网络结构参数进行建模,这种建模方法简称PSO-BRNN;(2)直接进行BRNN建模,即得到BRNN模型。采用实验数据依次完成上述对比模型的训练,利用所构建的模型对力学性能进行预测。

实验数据预测值和实测值之间的均方根误差和平均相对误差计算结果如表5所示,从表中可以看出BRNN模型经过粒子群算法优化后,屈服强度预测值和实测值的均方根误差由原来的22.65MPa降低到19.43MPa,平均相对误差由原来的0.062MPa降低到0.047MPa;抗拉强度预测值和实测值的均方根误差由原来的19.16MPa降低到16.12MPa,平均相对误差由原来的0.041MPa降低到0.029MPa;伸长率预测值和实测值的均方根误差由原来的9.58%降低到3.56%,平均相对误差由原来的0.139%降低到0.084%。

两种模型的确定性系数R

表5不同模型预测结果对比

图9示出了两种模型在测试数据上的预测误差分布情况。从图9中可以看出,两种模型的预测误差都呈现正态分布的特征,但PSO-BRNN预测模型的误差明显较窄,集中在中间区域,即模型的预测误差较小。而未经PSO优化的BRNN模型的误差分布较宽,意味着模型的预测误差较大,这表明BRNN模型经过PSO算法优化后,网络参数的选择更加合理,模型预测精度得到了提高。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号