首页> 中国专利> 基于规则辅助的高炉冶炼过程数据驱动建模方法

基于规则辅助的高炉冶炼过程数据驱动建模方法

摘要

本发明涉及一种基于规则辅助的高炉冶炼过程数据驱动建模方法,通过收集、整理专家知识得到IF…THEN…规则,根据IF…THEN…规则将采集的原始数据转化为规则数据,利用多核学习算法整合多个专家知识得到基于规则的规则预测模型,并建立数据驱动预测模型,通过Sigmoid函数将规则预测模型和数据驱动预测模型的输出决策值转换为后验概率,并对数据驱动预测模型和规则预测模型进行集成,获得规则辅助的数据驱动模型。由于将专家知识、模糊规则等异质信息与数据驱动模型进行集成,与现有技术相比,本发明建模方法可以显著提高数据驱动模型的预测精度和可解释性,从而提高高炉冶炼过程采集数据的利用率。

著录项

  • 公开/公告号CN107092743A

    专利类型发明专利

  • 公开/公告日2017-08-25

    原文格式PDF

  • 申请/专利权人 中国石油大学(华东);

    申请/专利号CN201710246244.1

  • 申请日2017-04-15

  • 分类号

  • 代理机构青岛联信知识产权代理事务所;

  • 代理人段秀瑛

  • 地址 266580 山东省青岛市黄岛区长江西路66号

  • 入库时间 2023-06-19 03:09:15

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-03-21

    未缴年费专利权终止 IPC(主分类):G06F30/27 专利号:ZL2017102462441 申请日:20170415 授权公告日:20200306

    专利权的终止

  • 2020-03-06

    授权

    授权

  • 2017-09-19

    实质审查的生效 IPC(主分类):G06F17/50 申请日:20170415

    实质审查的生效

  • 2017-08-25

    公开

    公开

说明书

技术领域

本发明属于数据挖掘与机器学习技术领域,涉及数据挖掘与数据处理方法,具体地说,涉及一种基于规则辅助的高炉冶炼过程数据驱动建模方法。

背景技术

数据驱动建模方法是当前的一个研究热点,学者们提出了大量数据驱动模型。数据驱动模型的应用范围非常广泛,涉及回归分析、聚类分析、分类问题、密度估计等诸多领域。其中,非线性模型凭借其强大的非线性逼近能力通常表现出较高的预测精度。然而,当前的非线性数据驱动模型仍存在以下两个亟待解决的主要问题:(1)无法有效整合专家知识、模糊规则等异质信息,导致无法进一步提升模型的精度;(2)缺乏可解释性,导致非线性数据驱动模型在许多对模型透明度较高的应用领域内使用受限。

近年来学者们针对非线性数据驱动模型存在的上述问题,开展了一系列试探性研究并取得初步研究成果。Jan与Jacek提出了一种从神经网络中提取规则的方法,该方法抽取的规则通过模拟网络背后的逻辑关系改进神经网络模型的推广能力。将先验知识融入非线性数据驱动模型则是另外一条有效途径。Maclin等人通过向SVMs优化问题加入不等式约束的方式合并先验知识到SVMs模型。更进一步,为了将非线性知识融入到非线性数据驱动模型中,Mangasarian等人借助理论分析将非线性先验知识转化为线性不等式约束。然而,上述方法都是针对具体算法设计的,无法实现规则知识与一般数据驱动模型的融合,导致这些数据驱动模型的精度低,可解释性差。

发明内容

本发明的目的在于针对LS-SVMs等现有数据驱动模型无法有效整合专家知识、模糊规则等多源异质数据导致精度无法进一步提高、数据驱动模型可解释性差等上述不足,提供了一种基于规则辅助的高炉冶炼过程数据驱动建模方法,该方法通过实现专家知识、模糊规则等信息与数据驱动模型的高效集成,进而提高数据驱动模型的精度和可解释性。

根据本发明一实施例,提供了一种基于规则辅助的高炉冶炼过程数据驱动建模方法,含有以下步骤:

(一)采集2000m3高炉冶炼过程实际数据,高炉实际采集数据具有时序特征,故在数据处理过程中保持数据先后顺序不变;采用如下数据处理方法i=1,…,n;j=1,…,d对采样数据进行预处理,其中表示原始采集数据,表示第j个特征的平均值,表示第j个采集变量的标准差,将采集数据转换为无量纲数据,消除数据的数量级差异,将上述预处理后的数据转换为规则数据,其具体步骤为:(1)收集并整理专家知识,利用决策树算法生成IF…THEN…规则:

(2)定义第k个样本点xk的第ip个特征关于基本规则区间的隶属度为:

其中,

(3)定义合取算子∧及析取算子计算and-型规则及or-型规则对样本xk的规则支持度为:

(4)利用规则支持度产生规则数据,规则数据表示为:

rk=(r1(xk),…,rm(xk))∈[01]m(6);

(二)采用多核学习算法融合多源规则数据,其具体步骤为:

(1)选择高斯RBF函数作为核函数,利用步骤(一)产生的p组规则数据i=1,…,p,分别产生核矩阵K1,…,Kp

(2)利用面向LS-SVMs的多核学习算法对p组规则数据进行融合:

s.t.||μ||≤1,

μi≥0,i=1,…,p+1,

其中fi(α)=αTKiα,i=1,…,p+1,

求解上述融合的优化问题,得到LS-SVMs模型正则化参数ν=μp+1及最优核矩阵系数μi(i=1,…,p),进而获得进行数据融合的规则核矩阵

(三)建立数据驱动预测模型,其具体步骤为:

利用LS-SVMs建立数据驱动模型为:

其中,w为分类超平面的法向量,b为分类超平面的截距项,ei为误差项,v≥0为模型正则化参数,表示特征映射,通过指定核函数的方式隐式确定;

通过求解上述数据驱动模型的KKT系统

得到数据驱动预测模型为:

(四)建立规则预测模型,其具体步骤为:将步骤(二)中的得到LS-SVMs模型正则化参数ν以及规则矩阵KR代入LS-SVMs模型的KKT系统

求解公式(11)表示的KKT系统得到规则预测模型:

(五)采用Sigmoid函数拟合将步骤(四)中规则预测模型的输出转换为后验概率,其具体步骤为:通过拟牛顿算法求解优化问题:

其中N+/N_分别为正/负类样本点个数;

得到Sigmoid函数的最优拟合参数A和B,进而将规则预测模型的输出决策值转化为后验概率进行输出,后验概率表示为:

(六)通过后验概率集成数据驱动预测模型和规则预测模型,建立规则辅助的数据驱动模型,其具体步骤为:通过步骤(五)分别拟合出数据驱动预测模型和规则预测模型的Sigmoid函数的最优拟合参数,将数据驱动预测模型和规则预测模型的决策值转换为后验概率PD和PR,并对数据驱动预测模型和规则预测模型进行集成,获得规则辅助的数据驱动模型为:

优选的,所述高炉冶炼过程实际数据包括控制参数和状态参数,所述控制参数包括喷煤量、风量、风温以及富氧量,所述状态参数包括高炉铁水硅含量、凸台温差、冶炼强度、透气性指数、料速、顶风压力以及炉渣碱度;以高炉铁水硅含量作为高炉炉温的表征,并选取其为规则辅助的数据驱动模型的输出变量,通过对高炉铁水硅含量进行一阶差分处理和符号函数的复合运算得到二元趋势变量yi=sign([Si]i-[Si]i-1),其中,y∈[1,-1],1对应炉温升高的趋势,-1对应炉温下降的趋势,[Si]i表示第i炉的高炉铁水硅含量实际采集数据;选择高炉冶炼过程实际数据除高炉铁水硅含量外的其他参数为规则辅助的数据驱动模型输入变量x=(x1,…,xd),并对输入变量进行预处理。

优选的,步骤采用Sigmoid函数拟合将步骤(三)中数据驱动预测模型的输出转换为后验概率,其具体步骤为:通过拟牛顿算法求解优化问题:

其中N+/N_分别为正/负类样本点个数;

得到Sigmoid函数的最优拟合参数A和B,进而将数据驱动预测模型的输出决策值转化为后验概率进行输出,后验概率表示为:

本发明提出的基于规则辅助的高炉冶炼过程数据驱动建模方法,选取高炉铁水硅含量([Si],又称为高炉化学温度)作为模型输出变量,通过对采样[Si]数据的一阶差分和符号函数复合运算得到二值型输出变量,进而可建立高炉炉温趋势预报模型。通过收集、整理专家知识得到IF…THEN…规则,根据IF…THEN…规则将采集的原始采集数据转化为规则数据,能有效抑制工业噪声、异常数据的影响,利用多核学习算法整合多个专家知识得到基于规则的规则预测模型,并建立数据驱动预测模型,通过Sigmoid函数将规则预测模型和数据驱动预测模型的输出决策值转换为后验概率,并对数据驱动预测模型和规则预测模型进行集成,获得规则辅助的数据驱动模型。通过根据本发明实施例的基于规则辅助的高炉冶炼过程数据驱动建模方法建立的数据驱动模型,由于将专家知识、模糊规则等异质信息与数据驱动模型进行集成,与现有技术相比,本发明建模方法建立的数据驱动模型的预测精度和可解释性得到显著提高,从而提高高炉冶炼过程采集数据的利用率。

附图说明

附图1为本发明具体实施例规则辅助的数据驱动建模的流程框图。

附图2a-d分别为本发明实施例CART算法产生的T1,T2,T3,T4四种决策规则图。

附图3为本发明实施例三种模型在国内某高炉冶炼过程数据上的预测效果图。

具体实施方式

以下结合附图对本发明实施例作进一步说明。

以国内某2000m3高炉冶炼过程实际采集数据为例。参见图1,一种基于规则辅助的高炉冶炼过程数据驱动建模方法,含有以下步骤:

(一)采集2000m3高炉冶炼过程实际数据,高炉实际采集数据具有时序特征,故在数据处理过程中保持数据先后顺序不变;所述高炉冶炼过程实际数据包括控制参数和状态参数,所述控制参数包括喷煤量、风量、风温以及富氧量,所述状态参数包括高炉铁水硅含量、凸台温差、冶炼强度、透气性指数、料速、顶风压力以及炉渣碱度;以高炉铁水硅含量作为高炉炉温的表征,并选取其为规则辅助的数据驱动模型的输出变量,通过对高炉铁水硅含量进行一阶差分处理和符号函数的复合运算得到二元趋势变量yi=sign([Si]i-[Si]i-1),其中,y∈[1,-1],1对应炉温升高的趋势,-1对应炉温下降的趋势,[Si]i表示第i炉的高炉铁水硅含量实际采集数据;选择高炉冶炼过程实际数据除高炉铁水硅含量外的其他参数为规则辅助的数据驱动模型输入变量x=(x1,…,xd),并对输入变量进行预处理;采用如下数据处理方法i=1,…,n;j=1,…,d对采样数据进行预处理,其中表示原始采集数据,表示第j个特征的平均值,表示第j个采集变量的标准差,将采集数据转换为无量纲数据,消除数据的数量级差异,降低各输入变量在数量级上的差异对趋势预报器的性能所产生的影响。将上述预处理后的数据转换为规则数据,其具体步骤为:

(1)选择待处理数据集合,从中选取200个样本点构造集合DR,用于产生决策树规则;其余样本点构造集合DV,用于验证模型。使用bootstrap方式对DR抽样,然后应用决策树算法在抽样上产生决策树。本实施例中,决策树算法采用CART算法。上述步骤执行多次,直到产生4个不同的决策树T1,T2,T3,T4,参见图2a-d。

(2)将验证集合DR分成学习集和测试集,从DV中随机选取P%的样本构造测试集,其余样本构造学习集,其中P∈{10,15,…,85,90},设学习集为{(x1,y1),…,(xk,yk),…,(xl,yl)},定义第k个样本点xk的第ip个特征关于基本规则区间的隶属度为:

其中,

(3)定义合取算子∧及析取算子计算and-型规则及or-型规则对样本xk的规则支持度为:

(4)利用规则支持度产生规则数据,规则数据表示为:

rk=(r1(xk),…,rm(xk))∈[01]m(6);

由此产生对应于决策树规则T1,T2,T3,T4的规则数据R1,R2,R3,R4

(二)采用多核学习算法融合多源规则数据,其具体步骤为:

(1)选择高斯RBF函数作为核函数,核宽参数σ取默认值,即输入数据的维数,利用规则数据R1,R2,R3,R4产生核矩阵K1,K2,K3,K4

(2)利用面向LS-SVMs的多核学习算法对4组规则数据进行融合:

s.t.||μ||≤1,

μi≥0,i=1,…,p+1,

其中fi(α)=αTKiα,i=1,…,p+1,

求解上述融合的优化问题,得到LS-SVMs模型正则化参数ν=μp+1及最优核矩阵系数μi(i=1,…,p),进而获得进行数据融合的规则核矩阵

(三)建立数据驱动预测模型,其具体步骤为:

利用LS-SVMs建立数据驱动模型为:

其中,w为分类超平面的法向量,b为分类超平面的截距项,ei为误差项,v≥0为模型正则化参数,此处取值为1,表示特征映射,通过指定核函数的方式隐式确定;

通过求解上述数据驱动模型的KKT系统

得到数据驱动预测模型为:

(四)建立规则预测模型,其具体步骤为:将步骤(二)中的得到LS-SVMs模型正则化参数ν以及规则矩阵KR代入LS-SVMs模型的KKT系统

求解公式(11)表示的KKT系统得到规则预测器:

(五)采用Sigmoid函数拟合将步骤(四)中规则预测模型的输出转换为后验概率,其具体步骤为:通过拟牛顿算法求解优化问题:

其中N+/N_分别为正/负类样本点个数;

得到Sigmoid函数的最优拟合参数A和B,进而将规则预测模型的输出决策值转化为后验概率进行输出,后验概率表示为:

同样地,采用Sigmoid函数拟合将步骤(三)中数据驱动预测模型的输出转换为后验概率,其具体步骤为:通过拟牛顿算法求解优化问题:

其中N+/N_分别为正/负类样本点个数;

得到Sigmoid函数的最优拟合参数A和B,进而将数据驱动预测模型的输出决策值转化为后验概率进行输出,后验概率表示为:

(六)通过后验概率集成数据驱动预测模型和规则预测模型,建立规则辅助的数据驱动模型,其具体步骤为:通过步骤(五)分别拟合出数据驱动预测模型和规则预测模型的Sigmoid函数的最优拟合参数,将数据驱动预测模型和规则预测模型的决策值转换为后验概率PD和PR,并对数据驱动预测模型和规则预测模型进行集成,获得规则辅助的数据驱动模型为:

分别应用本发明具体实施例上述基于规则辅助的高炉冶炼过程数据驱动建模方法(简称:Ensemble)、数据驱动建模方法(简称:Data)以及规则数据建模方法(简称:Rule),校验上述三种方法建模的有效性。数值实验结果参见图3,由图3可以看出,本发明实施例所提基于规则辅助的高炉冶炼过程数据驱动建模方法(图3中的Ensemble)在国内某高炉冶炼过程采集数据BF(a)上的测试精度优于其它两种建模方法(图3中的Data和Rule)。

上述实施例用来解释本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明做出的任何修改和改变,都落入本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号