法律状态公告日
法律状态信息
法律状态
2018-05-04
授权
授权
2015-03-25
实质审查的生效 IPC(主分类):G05B19/418 申请日:20140819
实质审查的生效
2015-02-25
公开
公开
技术领域
本发明涉及间歇反应器中间歇反应过程的控制优化领域,尤其涉及一种间歇反应过程的优化控制方法。
背景技术
间歇过程在化工生产中占有非常重要的地位,广泛应用于生产高附加值的产品,如精细化工产品、聚合物、生物制品、药品等.随着21世纪生化领域研究的飞速发展和相关产品的研发和生产,间歇过程将发挥更大的作用.然而,由于间歇反应过程自身所具有的强非线性、缺少稳态操作条件、反应过程的不确定性等特点,使得过程优化与控制具有一定的难度,因此提出更为有效的优化与控制策略是间歇反应过程中至关重要的一个环节
间歇反应过程的优化面对的一般是非线性、动态特性明显、大规模的复杂优化问题,采用传统的数学优化算法处理这些问题时存在一定的困难。近几年,对于该问题的研究比较活跃,Biegler等人偏重于联立算法解决大规模优化问题,并将其应用在非线性模型预测控制、参数估计、数据调整和过程综合等方面,Engel采用自优化控制、实时优化等反馈控制方法实现最优过程操作。周华等采用动态规划方法求解间歇反应过程的优化问题,结合通用模型控制算法实现间歇过程的动态优化和集成控制.贺益君等人采用粒子群优化(PSO)算法求解分批生化反应过程的动态优化问题.虽然智能优化算法可以依据计算机的迭代计算 能力,很好的求解该类动态优化问题,但是采用智能优化算法求解动态优化问题时在搜索和寻优性能方面还存在一定的缺陷,例如由于PSO算法的求解是多样性逐渐丧失的过程,所以该算法局部寻优能力较差且易于发生早熟收敛现象。
间歇反应过程的先进控制表现为通过上层优化确定最优轨迹后,如何在不违反操作条件和约束的情况下完成对最优设定轨线的准确跟踪问题。由于间歇过程的操作条件具有高度的非线性,采用线性模型预测控制(MPC)等控制策略缺乏补偿非线性的能力,无法满足间歇反应过程的控制要求。因此如何建立一个即可以考虑经济效益又可以保证系统良好的全局控制效果的优化控制策略目前特需解决的一个问题。
发明内容
本发明要解决的技术问题是如何在间歇反应过程的工业控制中兼顾了系统的经济效益优化和对最优参考轨迹的追踪效果,最终达到提高整个系统经济效益的效果。
为了解决这一技术问题,一种间歇反应过程的优化控制方法,包括如下步骤:
S100:采用TLBO算法,依据接收到的经济优化指标,计算出控制对象的最优值轨迹作为控制层的参考轨迹;
S200:在间歇反应过程中,采用一个线性广义预测控制器保证闭环系统的输入输出信号有界,采用一个非线性神经网络广义预测控制器补偿系统的非线性项,在每个采样时刻根据预设的切换性能指标选择线性广义预测控制器或非线性神 经网络广义预测控制器,使被控对象追踪S100得到的最优值轨迹;
S300:通过一个底层控制器抑制、消除进入到系统中的扰动对输出的影响,进而将控制对象的值输出。
在所述步骤S100中,包括如下步骤:
S101:将时间区间分成n个相同的区段,每段内控制对象的变量均为不变量,得到n个待优化的控制参数,从而将无限维时间变量离散为有限维时间变量;
S102:选择n个待优化的控制参数中的一个作为TLBO算法中的老师,其余作为TLBO算法中的学生;
S103:进行TLBO优化,得到控制对象的最优值轨迹作为控制层的参考轨迹。
所述线性广义预测控制器采用的线性估计模型M1表示为
式中:其中k表示采样时刻;y(k)、u(k)分别为系统的输出、输入;A(z-1)、B(z-1)为关于后移算子z-1的多项式,a,b分别为其系数
M1的模型参数可用如下带死区的辨识算法得到:
式中,δ>0为一已知的正常数
所述线性广义预测控制器中,在k时刻采用的优化性能指标表示为:
式中,wr(k+j)=awr(k+j-1)+(1-a)yref(k+j)为控制对象输出期望值,式中a为柔化因子,0<a<1,yref为输出参考轨迹。N为优化时域;Nu为控制时域;λj、rj为加权系数序列;
所述线性广义预测控制器的控制增量为:
式中
F=[F1(z-1),…,FN(z-1)]T
H=[H1(z-1),…,HN(z-1)]T
M=[M1(z-1),…,MN(z-1)]T
式中各变量参数根据求解控制增量过程中引入的丢番图方程(6),(7)得到的,e,f,g,h分别为各多项式系数,β为阶梯因子。
所述非线性神经网络广义预测控制器采用的估计模型M2可表示为
式中:其中k表示采样时刻;y(k)、u(k)分别为系统的输出、输入;A(z-1)、B(z-1)为关于后移算子z-1的多项式,a,b分别为其系数
M2的模型参数的辨识算法如下
式中,
为神经网络对非线性项的估计值,即
其中,z(k)=[y(k),...,y(k-na+1),...,Δu(k),...,Δu(k-nb)]T为系统的输入向量,Ψ(z(k))为神经网络的基函数,为神经网络的权值矩阵。
所述非线性神经网络广义预测控制器在k时刻采用的优化性能指标表示为:
Sj为加权多项式,并选择加权多项式sj(z-1)使得
(Sj(z-1)+Ej(z-1))v(k+j-1)=Mj(z-1)v(k-1),j=1,2,...,N (12)其中
M为非线性项多项式系数,m为多项式各项系数。
所述非线性神经网络广义预测控制器控制增量为:
所述切换性能指标表述为:
其中,T为正整数,c≥0是常数。i=1表示线性模型,i=2表示非线性模型,ei(k)为第i个模型在k时刻的输出误差。
本发明中,整个控制结构主要是由三层组成。上层结构是针对间歇反应过程中的优化问题,考虑过程动态模型,采用TLBO算法解决过程的动态优化问 题,从而获得其最大经济利益,称为优化层,优化层计算出控制对象(如:反应温度)的最优值轨迹作为控制层的参考轨迹;下层结构是针对间歇反应过程中的控制问题,考虑间歇反应过程中的非线性,控制器采用基于多模型切换的阶梯式广义预测控制器,由一个线性广义预测控制器、一个非线性神经网络广义预测控制器和切换机制组成,称为MPC层,MPC采用滚动优化的预测算法对过程的变量在满足模型动态行为的条件下进行调节,使期望的变量跟踪该优化设定值,底层为一PID控制器,主要是用来抑制、消除进入到过程中的扰动对输出的影响,称为基础控制层。三层结构共同作用于系统实现预想的目标。
附图说明
图1是本发明一实施例中的分层优化控制结构示意图;
图2是本发明一实施例中TLBO算法的优化效果示意图;
图3是本发明一实施例中基于TLBO算法和单模型GPC仿真结果示意图;
图4是本发明一实施例中的仿真结果示意图。
具体实施方式
以下将结合图1至图4对本发明提供的间歇反应器中间歇反应过程的优化控制方法进行详细的描述,其为本发明一可选的实施例,可以认为,本领域的技术人员在不改变本发明精神和内容的范围内能够对其进行修改和润色。
本方法的构思是:
整个控制结构主要是由三层组成。
上层结构是针对间歇反应过程中的优化问题,考虑过程动态模型,采用 TLBO算法解决过程的动态优化问题,从而获得其最大经济利益,称为优化层,优化层计算出控制对象(如:反应温度)的最优值轨迹作为控制层的参考轨迹;下层结构是针对间歇反应过程中的控制问题,考虑间歇反应过程中的非线性,控制器采用基于多模型切换的阶梯式广义预测控制器,由一个线性广义预测控制器、一个非线性神经网络广义预测控制器和切换机制组成,称为MPC层,MPC采用滚动优化的预测算法对过程的变量在满足模型动态行为的条件下进行调节,使期望的变量跟踪该优化设定值,底层为一PID控制器,主要是用来抑制、消除进入到过程中的扰动对输出的影响,称为基础控制层。三层结构共同作用于系统实现预想的目标。
本方法解决技术问题所采取的技术方案是:
一种间歇反应过程的优化控制策略设计,包括以下步骤:
S1:如图1所示,决策者确定间歇过程的经济优化指标,将最大化经济效益和最小化消耗成本的实现方式与实现约束体现在优化层中的经济目标函数Φ和约束条件d当中,优化层通过优化经济目标函数得到对象输出(如:反应温度)的最优设定值轨迹。
亦即步骤S100:采用TLBO算法,依据接收到的经济优化指标,计算出控制对象的最优值轨迹作为控制层的参考轨迹;
S2:跟踪上层优化得到最优设定值。多模型控制系统由线性广义预测控制器、非线性神经网络广义预测控制器及切换机制组成,线性广义预测控制器保证闭环系统的输入输出信号有界,非线性神经网络广义预测控制器补偿系统的非线性项,改善系统的性能,在每个采样时刻根据切换性能指标选择最优的控制器,使被控对象很好的追踪最优设定值轨迹;
亦即步骤S200:在间歇反应过程中,采用一个线性广义预测控制器保证闭 环系统的输入输出信号有界,采用一个非线性神经网络广义预测控制器补偿系统的非线性项,在每个采样时刻根据预设的切换性能指标选择线性广义预测控制器或非线性神经网络广义预测控制器,使被控对象追踪S100得到的最优值轨迹;
S3:优化轨迹送底层控制器调节(如PID控制器等)。通过底层控制器作用抑制、消除进入到过程中的扰动对输出的影响。将最终的变量值送到执行结构
亦即S300:通过一个底层控制器抑制、消除进入到系统中的扰动对输出的影响,进而将控制对象的值输出。
步骤S1中,采用TLBO算法求取控制对象的最优值轨迹步骤如下:
Step1.将时间区间[t0,tf]分成相同的Nd,每段内变量均为不变量,得到Nd个待优化的控制参数,将无限维时间变量离散为有限维时间变量,即确定问题维数。
Step2.定义优化问题和初始化优化问题参数.初始化群成员数,迭代代数以及优化问题的限制条件.
Step3.初始种群.根据群成员数及问题维数随机产生初始种群。
Step4.教师阶段,教师教授学生知识,进行教师阶段过程.
Step5.学生阶段,学生之间进行互相交流,提高成绩.
Step6.重复Step4,Step5,直到满足终止条件为止
换个角度来看,在所述步骤S100(即步骤S1)中,包括可以如下步骤:
S101:将时间区间分成n个相同的区段,每段内控制对象的变量均为不变量,得到n个待优化的控制参数,从而将无限维时间变量离散为有限维时间变量;
S102:选择n个待优化的控制参数中的一个作为TLBO算法中的老师,其余作为TLBO算法中的学生;
S103:进行TLBO优化,得到控制对象的最优值轨迹作为控制层的参考轨迹。
须知,TLBO(Teaching-Learning-Based Optimization:TLBO)算法是指教与学优化算法。
步骤S2中关于多模型广义预测控制器设计如下
假设间歇过程非线性系统表示为
A(z-1)Δy(k)=B(z-1)Δu(k-1)+v(k-1) (1)
式中,y(k)、u(k)分别为系统的输出、输入;Δ=1-z-1为差分算子;v(k-1)为非线性项;A(z-1)、B(z-1)为关于后移算子z-1的多项式。
v(k-1)=o(y(k-1),...,y(k-na),Δu(k-1),...,Δu(k-nb-1))·Δ
Δu(k-1)=u(k-1)-u(k-2)
根据非线性系统(1)设计多模型控制系统,该控制系统由一个线性广义预测控制器、一个非线性神经网络广义预测控制器和切换机制组成。下面分别对多模型控制器中线性GPC和非线性神经网络GPC求解控制量过程与控制器切换指标进行阐述。
1.线性广义预测控制
系统的线性估计模型M1可表示为
式中:其中k表示采样时刻;y(k)、u(k)分别为系统的输
出、输入;A(z-1)、B(z-1)为关于后移算子z-1的多项式,a,b分别为其系数;M1的模型参数可用如下带死区的辨识算法得到:
式中,
在k时刻采用优化性能指标
式中,wr(k+j)=awr(k+j-1)+(1-a)yref(k+j)为控制对象输出期望值,式中a为柔化因子,0<a<1,yref为输出参考轨迹。N为优化时域;Nu为控制时域;λj、rj为加权系数序列,将辨识得到的参数的值代入参数多项式A1(z-1),B1(z-1),并引入如下的两个丢番图方程:
B(z-1)Ej(z-1)=Gj(z-1)+z-jHj(z-1) (6)
式中
Ej(z-1)=1+ej,1z-1+…+ej,j-1z-(j-1)
Gj(z-1)…=gj,0+gj,1z-1+…+gj,j-1z-(j-1)
极小化性能指标函数(4),可得线性控制器的控制增量为:
式中
F=[F1(z-1),…,FN(z-1)]T
H=[H1(z-1),…,HN(z-1)]T
M=[M1(z-1),…,MN(z-1)]T
其中,e,f,g,h分别为各多项式系数,β为阶梯因子
2非线性神经网络广义预测控制器
系统的神经网络非线性估计模型M2可表示为
式中:
其中k表示采样时刻;y(k)、u(k)分别为系统的输出、输入;A(z-1)、B(z-1)为关于后移算子z-1的多项式,a,b分别为其系数;
M2的模型参数的辨识算法如下
式中,
为神经网络对非线性项的估计值,即
其中,z(k)=[y(k),...,y(k-na+1),...,Δu(k),...,Δu(k-nb)]T为系统的输入向量,Ψ(z(k))为 神经网络的基函数,为神经网络的权值矩阵。
在k时刻采用优化性能指标
Sj为加权多项式,并选择加权多项式sj(z-1)使得
(Sj(z-1)+Ej(z-1))v(k+j-1)=Mj(z-1)v(k-1),j=1,2,...,N (12)
其中
M为非线性项多项式系数,m为多项式各项系数。
将辨识得到的参数的值代入参数多项式A2(z-1),B2(z-1),将辨识得到的非线性项代入参数模型(8)中,引入丢番图公式(5),(6),极小化性能指标函数(11),可得神经网络控制器的控制增量为:
3.控制器切换指标
保证闭环切换系统的稳定性的前提下,可选择如下的切换性能指标[16]
其中,T为正整数,c≥0是常数。i=1表示线性模型,i=2表示非线性模型,ei(k)为第i个模型在k时刻的输出误差。μi(k)为第i个模型在k时刻的控制量输入。切换性能指标公式的前一部分处理模型估计误差较大的部分,从初始时刻开始累积,可以保证闭环切换系统的稳定性;后半部分为处理模型误差较小的部分,在有限时刻累加,其作用是提高系统的动态性能。
在k时刻,根据性能指标最小值切换到相应的控制器,将此控制器的输出作 为系统的输入。
与现有技术相比,本发明的有益效果如下:
1.降低系统成本消耗,提高系统经济效益
2.提高系统全局控制能力
3.采用TLBO算法,可以得到更优的优化效果
下面结合附图和具体实例对本发明做进一步的描述:
根据以下实施例可知,本方法至少为一对间歇反应器的反应温度的优化控制方法。故而,本实施例所称的控制对象即为间歇反应器的反应温度。
参考图1结构图并选取一间歇反应器作为研究案例依次来执行步骤。为验证本发明的优化控制策略,对一间歇反应器的优化控制案例进行仿真研究,间歇反应器的反应过程如下:
其中:A为反应物,B为目标产物,C为副产物。为使得整个反应过程的经济效益达到最大,须使B的转化率在反应结束时尽可能最大。在整个反应过程中,须将反应温度控制在298~398K之间.该反应是一个放热反应,通过夹套冷却的方法控制反应器的温度,从而提高反应过程的产品质量以及确保运行安全.假设冷却水进口温度以及夹套与反应器内的传热系数具有不确定性,不确定性通过操作过程中冷却水进出口的温度差来体现,其过程的数学模型如下:
k1=4000exp(-2500/T) (17)
k2=620000exp(-5000/T) (18)
Qr=ΔH1(k1x1V)+ΔH2(k2x2V) (20)
式中,x1、x2表示反应物A、30目标产物B的摩尔分率;k1、k2表示反应速率常数;T为反应温度;Fcw、Cpcw、ΔTcw为冷却水流量、热熔和冷却水进出口温差;Qr、ρ、Cpr分别表示反应热、反应物密度和反应物热熔;ΔH1、ΔH2为反应焓;V为反应器容量。将该系统模型分为优化模型部分和控制模型部分进行实施,其优化部分的模型由经济目标函数maxJ=x2(tf)和式(15)~(18)组成,其中参数取值范围x1,x2∈[0,1],T∈[298,398]。控制部分模型由式(19)~(20)组成。系统模型的参数取值如表1所示
表1间歇反应器过程参数
采用基于TLBO的动态优化算法对间歇式反应器的优化部分进行优化,优化算法中问题维度Nd=10,班级人数设置为30,迭代次数为100。优化得到间歇反应器反应温度的最优轨迹,并将该解作为控制反应温度的设定值,控制部分分别设计了单模型线性广义预测控制器和非线性多模型广义预测控制器。控制目标是使反应器的反应温度追踪优化得到的最优参考轨迹Tr。分别选择预测时域 长度和控制时域长度为N=4和Nu=2,自适应模型的初始参数ai,bi均取0.01,加权矩阵的各个系数为1,阶梯式因子β恒为1。对于多模型控制器,BP神经网络的学习率r=0.01、隐层节点数l=20,切换准则中的参数c=20,T=5。反应温度的动态优化结果如图2所示:
从反应机理模型分析,温度越高,反应速率常数k1,k2越大,在反应初始阶段反应物A浓度较大,目标产物B浓度较低,较高的反应温度有利于产物B生成,由于此时目标产物B浓度较低,生成副产物C的量也较小。随着反应的进行,反应温度应逐渐降低,降低反应速率常数k1,k2的值,因此可以将目标产物B积累起来,从而提高目标产物B的浓度。本文中的优化结果如图2所示,反应温度随反应的进行逐渐降低,与通过机理模型分析的结果符合,从而表明该动态优化算法的有效性和可行性。
将动态优化的解作为下层控制器的设定值参考轨迹,分别采用线性单模型GPC控制器和非线性多模型GPC控制器进行控制,控制结果如图3,图4。图中红色虚线表示动态优化得到的温度最优值轨迹,蓝色实线表示控制的控制输出。采用线性单模型GPC进行控制时(如图3所示),在反应初始阶段,设定值的大小变化较大,控制输出的值与设定值的偏差也较大,其追踪效果较差。而采用非线性多模型GPC进行控制时(如图4所示),控制输出的值与设定值的偏差较小,即输出更加贴近最优参考轨迹,由此可得,采用非线性多模型GPC控制器进行控制的控制效果要优于采用线性单模型GPC控制器。
目标产物B的最终产率为0.610625,与最优值0.610775很接近。,综上所述,采用基于TLBO动态优化算法和非线性多模型GPC控制器的双层优化控制策略,能够对间歇反应过程进行有效的控制,同时可以提高目标产物的产量。
机译: 通过实时自动测量生物废水处理过程中的非氧比和硝酸盐氮来优化间歇式间歇反应器工艺的方法和装置
机译: 在模块化间歇反应器设计中灵活优化微生物培养的培养
机译: 带有空调反应器和好氧/缺氧循环和间歇过程的废水处理厂,该过程集成在一个单元中,其中包括一个具有恒定和可控污泥再循环的二级沉降池。