首页> 中国专利> 结合过程先验和数据驱动模型的混合建模方法及系统

结合过程先验和数据驱动模型的混合建模方法及系统

摘要

本发明揭示了一种结合过程先验和数据驱动模型的混合建模方法及系统,所述方法包括:从已知的数据驱动模型中选择数据驱动模型和合适的模型结构建立对应模型的数学关系表达式,将所有的模型参数按照一定的顺序排列;对模型过程先验进行验证,得到检验模型违反过程先验程度的约束方程;将样本的模型输出和观测值比较,建立检验模型拟合训练样本程度的优化目标方程;将约束方程和优化目标方程联合,构建约束优化问题,采用约束处理智能算法求解最优参数解;将求解得到的最优参数解,作为S1的模型参数解,代入原模型中,用于模型预测或模型优化。本发明可以在少量数据样本的神经网络训练下得到更符合先验知识的模型,避免过拟合现象的发生。

著录项

  • 公开/公告号CN104915522A

    专利类型发明专利

  • 公开/公告日2015-09-16

    原文格式PDF

  • 申请/专利权人 华东理工大学;

    申请/专利号CN201510376700.5

  • 申请日2015-07-01

  • 分类号G06F17/50(20060101);

  • 代理机构31213 上海新天专利代理有限公司;

  • 代理人王敏杰

  • 地址 200237 上海市徐汇区梅陇路130号

  • 入库时间 2023-12-18 10:55:13

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-06-25

    授权

    授权

  • 2015-10-14

    实质审查的生效 IPC(主分类):G06F17/50 申请日:20150701

    实质审查的生效

  • 2015-09-16

    公开

    公开

说明书

技术领域

本发明属于化工过程建模领域,涉及一种过程建模方法,尤其涉及一种结合过程先验和 数据驱动模型的混合建模方法;同时,本发明还涉及一种结合过程先验和数据驱动模型的混 合模型。

背景技术

传统的机理信息建模方法必须对建模的系统有足够的了解,并且通过质量能量方程、反 应动力学方程等公式建立精确的描述模型。但是,实际工业过程复杂度高、反应机理多,难 以准确把握,导致机理信息建模常难以达到过程系统模型的精度要求。基于数据驱动的方法 迅速发展,并广泛应用于化工过程建模与优化。数据驱动建模方法的优点在于仅依托于历史 数据或现场实时数据,不需要明确的机理信息。对于复杂的非线性过程,在能够获取充足的 输入输出样本下,数据驱动建模常具有较好的效果。然而,数据驱动建模方法也有明显的缺 点,如机理表达的模糊,外延特性不好,以及在小样本建模中常见的过拟合现象。

目前的主要避免过拟合的方法主要利用样本自身信息(如外部检验法、引导重采样和噪 声注入技术扩充样本法)实现对过拟合现象的一定制约,但研究表明小样本建模作用有限。 过程对象本身存在诸多的机理信息难以应用,例如过程中大量的可以分析得到的一阶信息 (表现为单调性)、二阶信息(表现为凹凸性)和输出限制信息。一些学者也提出综合过程 机理的数据驱动建模方法(如带有机理的代理模型方法、输出增益检测的神经网络模型、合 概率密度估计的建模方法和单调神经网络),但是综合建模方法也存在一些缺陷,要么模型 结构过于简单,要么建模对象约束较高。

传统的机理信息结合样本信息的建模方法在克服过拟合问题上存在诸多的缺陷,容易对 部分有用信息进行舍弃。有鉴于此,如今迫切需要设计一种新的建模方法和模型,综合利用 机理信息和样本信息,客服小样本建模的过拟合问题。

发明内容

本发明所要解决的技术问题是:提供一种结合过程先验和数据驱动模型的混合建模方法, 可以在少量数据样本的神经网络训练下得到更符合先验知识的模型,避免过拟合现象的发生。

此外,本发明还提供一种结合过程先验和数据驱动模型的混合系统,可以在少量数据样 本的情形下训练得到更符合先验知识的数据驱动模型,避免过拟合现象的发生和提高模型鲁 棒性。

为解决上述技术问题,本发明采用如下技术方案:

一种结合过程先验和数据驱动模型的混合建模方法,所述方法包括如下步骤:

步骤S1、从已知的数据驱动模型中选择合适的数据驱动模型和合适的模型结构,建立对 应模型的数学关系表达式,将所有的模型参数按照一定的顺序排列;

步骤S2、定步扫描方法对模型过程先验(主要包括输出响应信息、输出响应的一阶信息 (表现为单调性)和二阶信息(表现为凹凸性)进行验证,得到检验模型违反过程先验程度 的约束方程;

步骤S3、将样本的模型输出和观测值比较,根据均方差公式和正则化方法建立检验模型 拟合训练样本程度的优化目标方程;

步骤S4、将约束方程和优化目标方程联合,构建约束优化问题,采用约束处理智能算法 求解最优参数解;

步骤S5、将求解得到的最优参数解,作为S1的模型参数解,代入原模型中,用于模型预 测或模型优化。

作为本发明的一种优选方案,所述步骤S1的模型数学关系表达式和模型参数排列:选择 某一数据驱动模型,一般的我们常选择BP神经网络模型、响应曲面模型、支持向量机等。

对于BP神经网络模型,其模型输入输出关系式为:

y^l(par,X)=fh-o(Σi=1HTli×fi-h(Σj=1Lwijxj-θj)-θl),l=1,2,...,B---(1)

其中:

par为模型参数排列,在BP网络模型中为所有权值和阈值的一种固定排列,包括所有的 wij,Tli,θj和θl

X为输入向量组合,也可表示成(x1,x2,…,xL),

wij为输入层到隐含层的权值系数,

θj为隐含层各神经元的阈值系数,

Tli为隐含层到输出层的权值系数,

θl为输出层神经元的阈值系数,

L为输入层神经元数,由实际系统的输入变量决定,

H为隐含层神经元数,为建模者根据经验或者试凑法不确定方法来决定,

B为输出层神经元数,由于研究对象为多输入单输出对象,输出层神经元数取1,

fi-h为隐含层激活函数,激活函数种类繁多,简单线性函数(purelin)、有sigmoid函 数(tansig和logsig)、正弦函数、双曲正切和反正切,自适应多项式函数等。常用的包括 tansig,logsig和purelin三种,一般隐含层选取tansig或logsig,

fh-o为隐含层激活函数,一般选取purelin;

类似的,对于响应曲面模型,其模型输入输出关系式为:

y^l(par,X)=b0+Σi=1Lbi×xi+Σk=j+1LΣj=1Lbjk×xj×xk+Σl=1Lbl×xl2---(2)

其中:

par表示模型参数组合,包含b0、bi、bjk和bl

b0为常数项,

bi为输入xi的一阶项,

bjk为输入xj和xk的相关系数项,

bl为输入xl的二阶项,

xi为第i个输入变量,共计L维;

作为本发明的一种优选方案,所述步骤S2通过以下3个子步骤获得模型的约束方程表达 式:

步骤S2.1、检测点采样:在整个空间用固定步长Δij将整个空间进行划分成多个子空 间,分别在子空间内采样,作为输出范围先验的多次检测。同样的,用固采定步长Δij将已知 的单调性先验和凹凸性先验的区间划分成个更小的子区间,标记为 [xiLj+(m-1)Δij,xiLj+ij](m=1,2,...,Mij);

步骤S2.2、采样点的先验检测:对于整个对象输入空间内的输出范围检测,可通过采样 点的输出值与输出上下限比较得到,已知输出上限为yH,下限为yL,比较检验模型输出值 与它们的关系,当且仅当时,输出范围先验正确,否则在该小区域内违反输 出范围先验。若所有采样点均符合输出范围检验结果,则近似认为模型对该条单调先验无违 反。对于该小区间内的单调信息正确性检验可通过多次固定其他输入变量值,仅求解区间两 端点(和)的输出值,比较大小检验单调性信息,若输出值比较结果与单调信息符合, 近似认为该小区间符合单调信息。例如,若该区间为单调递增区间,必有若为单 调递减区间,必有若所有小区间均符合单调信息检验结果,则近似认为模型对该 条单调先验无违反。同理,检验该小区间的凹凸性可采用两端点(和)和中点() 的输出值比较,近似检验小区间的凹凸信息。例如,若该区间为严格凸区间,必有 若为严格凹区间,必有可用符号函数表示每一条 先验的每一次检验结果,如公式(3)、公式(4)和公式(5),公式(3)用于检验输出范围,公式 (4)用于检验单调性先验,公式(5)用于检验凹凸性先验;

h(i,j,m)=min(sgn(y^m-yL),sgn(yH-y^m))---(3)

h(i,j,m)={sgn(y^m-y^m-1)>if>[xiLj,xiUj]is>an>increasingintervalsgn(y^m-1-y^m)>if>[xiLj,xiUj]is>a>decreasinginterval---(4)

h(i,j,m)={sgn(y^m+y^m-1-2×y^×m-0.5)if[xiLj,xiUj]isanconcaveintervalsgn(2×y^m-0.5-y^m-y^m-1)if[xiLj,xiUj]isanconvexinterval---(5)

其中,h(i,j,m)为第i维上第j条已知先验的第m次检测结果;

如果每一个h(i,j,m)对应的值均为“1”,则近似认为模型完全符合对应先验; h(i,j,m)为“-1”,模型在对应的小区间内必然违背对应先验知识;

步骤S2.3、违反程度统计:根据统计“-1”的次数占所有扫描检验次数的比例viol,刻 画模型的先验机理违反程度,计算公式如下:

viol=Σi=1LΣj=1JiΣm=1Mij[1-h(i,j,m)2]/Σi=1LΣj=1JiMij,i=1,2,...,L;j=1,2,...,Ji;m=1,2,...,Mij---(6)

如果系统模型完全符合所有过程先验,viol值为0。viol值较小代表模型轻微违反已知的 过程先验;viol越接近1,表示模型违反过程的程度越大。

作为本发明的一种优选方案,所述步骤S3通过以下2个子步骤获得模型的优化目标函数 F(W):

步骤S3.1、构建数据驱动模型输出值与测量值的均方差模型,见公式(7):

ED=Σk=1N(y^i,k(par,X)-yl,k(X))2---(7)

为第k个样本的模型输出,计算公式参考模型数学关系式,例如若是选择BP网络则 参考公式(1),若是选择响应曲面模型则选择公式(2),选择其他数据驱动建模方法则建立 对应的模型数学关系式,

yl,k为第k个样本的观测值,参考训练样本的采样输出值,

X为输入变量组合,可表示成(x1,x2,…,xL),L是输入变量的维度;

步骤S3.2、在原始均方差项上加入正则化项,并取合适的正则化系数,构建优化目标函 数(参考公式(8)),目标函数中加入正则化项,可以使模型获得相对平缓的输出响应曲线, 使模型较好的拟合训练样本,同时有较强的鲁棒性和预测能力:

F(par)=ED+ηEw                      (8)

Ew正则化项,计算网络未知参数的平方和,例如BP网络模型计算响 应曲面模型计算

η为正则化系数,正则化系数权衡模型的平滑程度,一般取值0.001,

F(par)为带有未知模型参数的训练目标函数;

作为本发明的一种优选方案,所述步骤S4具体包括:组合构造的约束函数和目标优化函 数,构成约束优化问题,如公式(9)。代入可处理约束的智能优化算法,求解满足先验约束的 目标函数的最优解,最优解即是模型参数最优组合:

min F(par)=ED+ηEw

                                     (8)

s.t. voil=0

处理约束优化问题的确定性方法(可行方向法等)容易陷入局部最优,采用带约束的智能 算法处理等式约束,例如引入带自适应松弛约束处理方法的μAEA算法,该算法有较好的等式 约束处理能力;

作为本发明的一种优选方案,所述步骤S5具体包括:将求解得到的参数组合par代入S1 选择的数据驱动模型中,组成确定参数的模型,选择BP网络模型代入公式(1),选择响应曲 面模型代入公式(2)。根据确定参数的模型,代入新样本即可验证模型的预测能力;

一种结合过程先验和数据驱动模型的混合建模方法,所述方法包括如下步骤:

步骤S1、从已知的数据驱动模型中选择合适的数据驱动模型和合适的模型结构,建立对 应模型的数学关系表达式,将所有的模型参数按照一定的顺序排列,

步骤S2、定步扫描方法对模型过程先验(主要包括输出响应信息、输出响应的一阶信息 (表现为单调性)和二阶信息(表现为凹凸性)进行验证,得到检验模型违反过程先验程度 的约束方程,

步骤S3、将样本的模型输出和观测值比较,根据均方差公式和正则化方法建立检验模型 拟合训练样本程度的优化目标方程,

步骤S4、将约束方程和优化目标方程联合,构建约束优化问题,采用约束处理智能算法 求解最优参数解,

步骤S5、将求解得到的最优参数解,作为S1选择的模型的参数解,代入原模型中,用于 模型预测或模型优化;

一种结合过程先验和数据驱动模型的混合建模系统,所述系统包括:

训练样本集和先验知识获取模块,用以进行建模时构造目标函数;

数据驱动模型选择模块,构造数学函数表达式:若是选择BP网络模型,要选择适当的激 活函数和隐含层神经元,确定BP网络模型结构,若是选择响应曲面模型,按照公式(2)组 合;

约束函数构造模块,根据定步检验法统计先验的约束违反频率,构造约束函数,用以作 为约束优化问题的约束;

优化目标函数构造模块,代入训练样本构造结合均方差项和正则化项的训练目标函数, 用以作为约束优化问题的优化目标;

约束优化问题求解模块,用以通过可处理约束的智能优化算法求解约束优化问题的最优 参数解;

参数回代模块,将求解得到的高维参数按照模型构造时的参数组合方式回代入模型,得 到确定结构和参数的模型。建模过程结束,模型可用于新样本的输出预测或者对象输入优 化。

本发明的有益效果在于:本发明提出的结合过程先验和数据驱动模型的混合建模方法及 系统,可以在少量数据样本的情况下下得到更符合先验知识的数据驱动模型,避免过拟合现 象的发生。

本发明从一个全新的视角——结合过程先验信息和样本数据信息构建混合模型,实现了 对建模对象的准确建模,克服了建模过拟合问题。在保证模型有效性的前提下,该方法较之 于传统的数据驱动建模方法(如BP神经网络模型、响应曲面模型)更加符合过程先验,且具有 较好的预测能力和鲁棒性。

本发明引入过程先验实现更为准确的数据驱动建模。混合建模是近年来兴起的一种建模 思路,广泛用于各类化工过程预测和优化领域,但其融合方法一直是一大难题。由于数据驱 动建模方法以拟合样本为目标,能够较好的拟合样本能力,具有固定的输入输出关系,可以 构造参数优化函数;同时,过程机理信息对模型响应具有一定的指导和判别作用,可用于构 造模型约束。另外,根据构造的优化目标函数和约束函数,采用性能良好的约束处理只能算 法,实现对模型参数的求解。该发明不仅能够避免小样本建模的过拟合问题,而且能保证模 型机理信息的正确性,同时也能够一定程度上保证模型具有良好的鲁棒性。

附图说明

图1纳滤膜平均溶胶半径样本的模型预测值和实际观测值对比;

图2一段加氢反应器的氢气进料率、一段反应罐进出口温差对乙炔出口浓度的响应图;

图3为本发明建模方法流程图。

具体实施方式

下面结合附图详细说明本发明的优选实施例。

实施例一

请参阅图3,本发明提出了一种结合过程先验和数据驱动模型的混合建模方法,具体步骤 如下:

【步骤S1】从已知的数据驱动模型中选择合适的数据驱动模型和合适的模型结构, 建立对应模型的数学关系表达式,将所有的模型参数按照一定的顺序排列。

步骤S1的模型数学关系表达式和模型参数排列par:选择某一数据驱动模 型,一般的我们常选择BP神经网络模型、响应曲面模型、支持向量机等。

对于BP神经网络模型,其模型输入输出关系式为:

y^l(par,X)=fh-o(Σi=1HTli×fi-h(Σj=1Lwijxj-θj)-θl),l=1,2,...,B---(1)

其中:

par为模型参数排列,在BP网络模型中为所有权值和阈值的一种固定排列,包括所有的 wij,Tli,θj和θl

X为输入向量组合,也可表示成(x1,x2,…,xL),

wij为输入层到隐含层的权值系数,

θj为隐含层各神经元的阈值系数,

Tli为隐含层到输出层的权值系数,

θl为输出层神经元的阈值系数,

L为输入层神经元数,由实际系统的输入变量决定,

H为隐含层神经元数,为建模者根据经验或者试凑法不确定方法来决定,

B为输出层神经元数,由于研究对象为多输入单输出对象,输出层神经元数取1,

fi-h为隐含层激活函数,激活函数种类繁多,简单线性函数(purelin)、有sigmoid函 数(tansig和logsig)、正弦函数、双曲正切和反正切,自适应多项式函数等。常用的包括 tansig,logsig和purelin三种,一般隐含层选取tansig或logsig,

fh-o为隐含层激活函数,一般选取purelin;

类似的,对于响应曲面模型,其模型输入输出关系式为:

y^l(par,X)=b0+Σi=1Lbi×xi+Σk=j+1LΣj=1Lbjk×xj×xk+Σl=1Lbl×xl2---(2)

其中:

par表示模型参数组合,包含b0、bi、bjk和bl

b0为常数项,

bi为输入xi的一阶项,

bjk为输入xj和xk的相关系数项,

bl为输入xl的二阶项,

xi为第i个输入变量,共计L维;

【步骤S2】定步扫描方法对模型过程先验(主要包括输出响应信息、输出响应的一阶 信息(表现为单调性)和二阶信息(表现为凹凸性)进行验证,得到检验模型违反过程先验 程度的约束方程;

步骤S2通过以下3个子步骤获得模型的约束方程表达式:

步骤S2.1、检测点采样:在整个空间用固定步长Δij将整个空间进行划分成多个子空 间,分别在子空间内采样,作为输出范围先验的多次检测。同样的,用固采定步长Δij将已知 的单调性先验和凹凸性先验的区间划分成个更小的子区间,标记为 [xiLj+(m-1)Δij,xiLj+ij](m=1,2,...,Mij);

步骤S2.2、采样点的先验检测:对于整个对象输入空间内的输出范围检测,可通过采样 点的输出值与输出上下限比较得到,已知输出上限为yH,下限为yL,比较检验模型输出值 与它们的关系,当且仅当时,输出范围先验正确,否则在该小区域内违反输 出范围先验。若所有采样点均符合输出范围检验结果,则近似认为模型对该条单调先验无违 反。对于该小区间内的单调信息正确性检验可通过多次固定其他输入变量值,仅求解区间两 端点(和)的输出值,比较大小检验单调性信息,若输出值比较结果与单调信息符合, 近似认为该小区间符合单调信息。例如,若该区间为单调递增区间,必有若为单 调递减区间,必有若所有小区间均符合单调信息检验结果,则近似认为模型对该 条单调先验无违反。同理,检验该小区间的凹凸性可采用两端点(和)和中点() 的输出值比较,近似检验小区间的凹凸信息。例如,若该区间为严格凸区间,必有 若为严格凹区间,必有可用符号函数表示每一条 先验的每一次检验结果,如公式(3)、公式(4)和公式(5),公式(3)用于检验输出范围,公式 (4)用于检验单调性先验,公式(5)用于检验凹凸性先验;

h(i,j,m)=min(sgn(y^m-yL),sgn(yH-y^m))---(3)

h(i,j,m)={sgn(y^m-y^m-1)>if>[xiLj,xiUj]is>an>increasingintervalsgn(y^m-1-y^m)>if>[xiLj,xiUj]is>a>decreasinginterval---(4)

h(i,j,m)={sgn(y^m+y^m-1-2×y^m-0.5)if[xiLj,xiUj]isanconcaveintervalsgn(2×y^m-0.5-y^m-y^m-1)if[xiLj,xiUj]isanconvexinterval---(5)

其中,h(i,j,m)为第i维上第j条已知先验的第m次检测结果;

如果每一个h(i,j,m)对应的值均为“1”,则近似认为模型完全符合对应先验; h(i,j,m)为“-1”,模型在对应的小区间内必然违背对应先验知识;

步骤S2.3、违反程度统计:根据统计“-1”的次数占所有扫描检验次数的比例viol,刻 画模型的先验机理违反程度,计算公式如下:

viol=Σi=1LΣj=1JiΣm=1Mij[1-h(i,j,m)2]/Σi=1LΣj=1JiMij,i=1,2,...,L;j=1,2,...,Ji;m=1,2,...,Mij---(6)

如果系统模型完全符合所有过程先验,viol值为0。viol值较小代表模型轻微违反已知的 过程先验;viol越接近1,表示模型违反过程的程度越大。

【步骤S3】将样本的模型输出和观测值比较,根据均方差公式和正则化方法建立检 验模型拟合训练样本程度的优化目标方程;

步骤S3通过以下2个子步骤获得模型的优化目标函数F(W):

步骤S3.1、构建数据驱动模型输出值与测量值的均方差模型,见公式(7):

ED=Σk=1N(y^l,k(par,X)-yl,k(X))2---(7)

为第k个样本的模型输出,计算公式参考模型数学关系式,例如若是选择BP网络则 参考公式(1),若是选择响应曲面模型则选择公式(2),选择其他数据驱动建模方法则建立 对应的模型数学关系式,

yl,k为第k个样本的观测值,参考训练样本的采样输出值,

X为输入变量组合,可表示成(x1,x2,…,xL),L是输入变量的维度;

步骤S3.2、在原始均方差项上加入正则化项,并取合适的正则化系数,构建优化目标函 数(参考公式(8)),目标函数中加入正则化项,可以使模型获得相对平缓的输出响应曲线, 使模型较好的拟合训练样本,同时有较强的鲁棒性和预测能力:

F(par)=ED+ηEw                  (8)

Ew正则化项,计算网络未知参数的平方和,例如BP网络模型计算响 应曲面模型计算

η为正则化系数,正则化系数权衡模型的平滑程度,一般取值0.001,

F(par)为带有未知模型参数的训练目标函数;

【步骤S4】将约束方程和优化目标方程联合,构建约束优化问题,采用约束处理曾 算法求解最优参数解;

步骤S4具体包括:组合构造的约束函数和目标优化函数,构成约束优化问题,如公式 (9)。代入可处理约束的智能优化算法,求解满足先验约束的目标函数的最优解,最优解即 是模型参数最优组合:

min F(par)=ED+ηEw

                                    (9)

s.t. voil=0

处理约束优化问题的确定性方法(可行方向法等)容易陷入局部最优,采用带约束的智能 算法处理等式约束,例如引入带自适应松弛约束处理方法的μAEA算法,该算法有较好的等式 约束处理能力;

【步骤S5】将求解得到的最优参数解,作为S1的模型参数解,代入原模型中,用于 模型预测或模型优化。

步骤S5具体包括:将求解得到的参数组合par代入S1选择的数据驱动模型中,组成确 定参数的模型,选择BP网络模型代入公式(1),选择响应曲面模型代入公式(2)。根据确定 参数的模型,代入新样本即可验证模型的预测能力;

实施例二

通过以下实施例的说明将有助于理解本发明,但并不限制本发明的内容。请参阅图2, 本实施例实现了基于水解温度、甘油添加量和络合剂添加量下的纳滤膜溶胶平均粒径估计, 输入变量对溶胶粒径的影响如表1所示。本实施例研究的纳滤膜溶胶制备过程为稳态过程, 过程数据采自实验得到的46组样本(溶胶粒径稳定性能数据获取周期长(一个月左右),无 法获取大量样本)。其他变量参数如下:前驱体摩尔比为Zr:Ti=4,前驱体与水的摩尔比为 1:555,溶胶浓度0.1mol/L,以及络合时长为1h,实验输入变量范围为:水解温度:50~90° C,甘油与前驱体摩尔比0~1.2,络合剂的摩尔比3~8。将46组样本分成2部分,随机选择35 组作为训练样本,11组作为测试样本。选择BP神经网络模型,试凑法确定BP网络模型结构 为3-5-1模型时较为合适,参考公式1建立数学关系式。

表1:水解温度、甘油添加量和络合剂添加量对纳滤膜平均溶胶半径的影响

(1)根据公式(1),构造“3-5-1”结构下的BP网络数学模型包含权值20个 和阈值6个,最终优化目标函数为26维;

(2)根据先验信息,选择合适的步长,采用固定步长,对表1的先验知识进行检验,将检测 得到的违反次数百分比作为约束函数voil;

(3)根据BP网络数学模型和训练样本观测值,构造均方差项ED

(4)在构造的均方误差项下加入正则化项Ew,正则化系数η通过试凑,选取0.001,构成优 化目标函数F(par),F(par)中包含26个未知参数;

(5)组合构造的约束函数和目标优化函数,构成约束优化问题,代入约束处理智能算法(本 例选取uAEA算法),求解满足先验约束的目标函数的最优解;

(6)求解得到的参数组合par代入模型中,组成确定的BP网络模型;

(7)代入测试样本新样本可验证模型的预测能力,样本真实值和模型预测值如图1,前35组 为训练样本,后11组为测试样本;

(8)计算训练样本集的均方差为0.1085,测试样本集的均方差为0.1899。

结果表明,采用本发明的结合过程先验和数据驱动模型的混合建模方法,应用于陶瓷纳 滤膜的平均溶胶粒径估计得到的模型具有较好的预测效果,是有效的,可用于其他样本的粒 径估计。本发明提出的方法能有效避免小样本建模的过拟合问题。值得注意的是,由于BP网 络引入过程先验,本发明提出的方法不仅在先验表达上无误差,而且能表现出较好的系统鲁 棒性。

实施例三

通过以下实施例的说明将有助于理解本发明,但并不限制本发明的内容。本实例的分析 对象是乙烯生产装置的乙炔加氢反应器的一段反应釜(如图3中有色圆)。本文选择了C2馏 分进料率,氢气进料率以及一段反应罐进出口温差三个变量作为软测量的易测量(自变量), 建立软测量模型估计一段反应罐乙炔出口浓度。

本实施例研究的一段反应罐乙炔软测量,过程数据采自实验得到的40组样本。将40组 样本分成2部分,随机选择30组作为训练样本,10组作为测试样本。选择BP神经网络模型, 试凑法确定BP网络模型结构为3-4-1模型时较为合适,参考公式1建立数学关系式。

根据反应机理,本实施例的先验知识如下表所示:

表2:C2馏分进料率,氢气进料率以及一段反应罐进出口温差对乙炔出口浓度的影响

(1)根据公式(1),构造“3-4-1”结构下的BP网络数学模型包含权值16个 和阈值5个,最终优化目标函数为21维;

(2)根据先验信息,选择合适的步长,采用固定步长,对表2的先验知识进行检验,将检测 得到的违反次数百分比作为约束函数voil;

(3)根据BP网络数学模型和训练样本观测值,构造均方差项ED

(4)在构造的均方误差项下加入正则化项Ew,正则化系数η通过试凑,选取0.001,构成优 化目标函数F(par),F(par)中包含21个未知参数;

(5)组合构造的约束函数和目标优化函数,构成约束优化问题,代入约束处理智能算法(本 例选取uAEA算法),求解满足先验约束的目标函数的最优解;

(6)求解得到的参数组合par代入模型中,组成确定的BP网络模型;

(7)代入测试样本新样本可验证模型的预测能力,计算训练样本集的均方差为 7.173×10-4,测试样本集的均方差为5.253×10-4。同时分别作出当C2馏分进料量处于低、 中、高三个值时的相应的氢气进料率、一段反应罐进出口温差对乙炔出口浓度的响应图,如 图2。

结果表明,采用本发明的结合过程先验和数据驱动模型的混合建模方法,应用于一段反 应罐乙炔浓度软测量具有较好的预测效果,是有效的,可用于预测其他输入下的乙炔出口浓 度。本发明提出的方法能有效避免小样本建模的过拟合问题。值得注意的是,由于BP网络引 入过程先验,本发明提出的方法不仅在先验表达上无误差,而且能表现出较好的系统鲁棒性 (图2)。

实施例四

一种结合过程先验和数据驱动模型的混合建模方法,所述方法包括如下步骤:

步骤S1、从已知的数据驱动模型中选择合适的数据驱动模型和合适的模型结构,建立对 应模型的数学关系表达式,将所有的模型参数按照一定的顺序排列;

步骤S2、定步扫描方法对模型过程先验(主要包括输出响应信息、输出响应的一阶信息 (表现为单调性)和二阶信息(表现为凹凸性)进行验证,得到检验模型违反过程先验程度 的约束方程;

步骤S3、将样本的模型输出和观测值比较,根据均方差公式和正则化方法建立检验模型 拟合训练样本程度的优化目标方程;

步骤S4、将约束方程和优化目标方程联合,构建约束优化问题,采用约束处理智能算法 求解最优参数解;

步骤S5、将求解得到的最优参数解,作为S1的模型参数解,代入原模型中,用于模型预 测或模型优化。

本发明还揭示一种结合过程先验和数据驱动模型的混合模型,所述系统包括:训练样本 集和先验知识获取模块、数据驱动模型选择模块、约束函数构造模块、优化目标函数构造模 块、约束优化问题求解模块和参数回代模块。

训练样本集和先验知识获取模块,用以进行建模时构造目标函数;

数据驱动模型选择模块,构造数学函数表达式:若是选择BP网络模型,要选择适当的激 活函数和隐含层神经元,确定BP网络模型结构,若是选择响应曲面模型,按照公式(2)组 合;

约束函数构造模块,根据定步检验法统计先验的约束违反频率,构造约束函数,用以作 为约束优化问题的约束;

优化目标函数构造模块,代入训练样本构造结合均方差项和正则化项的训练目标函数, 用以作为约束优化问题的优化目标;

约束优化问题求解模块,用以通过可处理约束的智能优化算法求解约束优化问题的最优 参数解;

参数回代模块,将求解得到的高维参数按照模型构造时的参数组合方式回代入模型,得 到确定结构和参数的模型。建模过程结束,模型可用于新样本的输出预测或者对象输入优 化。

各个模块的具体实现方式可参阅实施例一中各个步骤对应的实现过程。

综上所述,本发明提出的结合过程先验和数据驱动模型的混合方法及系统,可克服传统 数据驱动建模的过拟合问题,使得最终模型,不仅与过程先验相符合,而且具有良好的鲁棒 性,能实现对已知一定机理信息的对象更准确的建模。

本发明从一个全新的视角——结合过程先验信息和样本数据信息构建混合模型,实现了 对建模对象的准确建模,克服了建模过拟合问题。在保证模型有效性的前提下,该方法较之 于传统的数据驱动建模方法(如BP神经网络建模、响应曲面法、支持向量机等)更加符合过程 先验,且具有较好的预测能力和鲁棒性。

本发明引入过程先验实现更为准确的数据驱动建模。混合建模是近年来兴起的一种建模 思路,广泛用于各类化工过程预测和优化领域,但其融合方法一直是一大难题。由于数据驱 动建模拥有拟合样本的能力,具有固定的输入输出关系,可以构造参数优化函数;同时,过 程机理信息对模型响应具有一定的知道和判别作用,可用于构造模型约束。另外,根据构造 的优化目标函数和约束函数,采用性能良好的约束处理进化算法,实现对模型参数的求解, 该发明不仅能够避免小样本建模的过拟合问题,而且能保证模型机理信息的正确性,同时也 能够一定程度上保证模型具有良好的鲁棒性。

这里本发明的描述和应用是说明性的,并非想将本发明的范围限制在上述实施例中。这 里所披露的实施例的变形和改变是可能的,对于那些本领域的普通技术人员来说实施例的替 换和等效的各种部件是公知的。本领域技术人员应该清楚的是,在不脱离本发明的精神或本 质特征的情况下,本发明可以以其它形式、结构、布置、比例,以及用其它组件、材料和部 件来实现。在不脱离本发明范围和精神的情况下,可以对这里所披露的实施例进行其它变形 和改变。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号