首页> 中国专利> 一种受控随机系统的无限时域鲁棒控制器的控制方法

一种受控随机系统的无限时域鲁棒控制器的控制方法

摘要

本发明公开了一种受控随机系统的无限时域鲁棒控制器的控制方法,受控随机系统为离散时间含马尔科夫跳的随机乘积噪声受控系统;控制方法包括:a控制输入u

著录项

  • 公开/公告号CN105259757A

    专利类型发明专利

  • 公开/公告日2016-01-20

    原文格式PDF

  • 申请/专利权人 山东科技大学;

    申请/专利号CN201510690826.X

  • 发明设计人 侯婷;马宏基;

    申请日2015-10-22

  • 分类号G05B13/04;

  • 代理机构济南舜源专利事务所有限公司;

  • 代理人王连君

  • 地址 266590 山东省青岛市经济技术开发区前湾港路579号

  • 入库时间 2023-12-18 13:47:49

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-10-17

    授权

    授权

  • 2016-02-17

    实质审查的生效 IPC(主分类):G05B13/04 申请日:20151022

    实质审查的生效

  • 2016-01-20

    公开

    公开

说明书

技术领域

本发明属控制工程领域,具体地说是涉及一类含马尔科夫跳的离散时间随机乘积噪声系 统的无限时域鲁棒控制器的控制方法。

背景技术

控制系统设计的基本任务是为系统设计一个反馈控制律,使得闭环系统既保持稳定性, 又具有满意的系统性能。一方面,保证稳定性是控制系统正常工作的必要前提。由于建模误 差、外界干扰、系统故障等情况的发生,导致了不确定性在控制系统中广泛存在。设计控制 器使系统在不确定性影响下仍具有指定容许误差范围内的系统响应和系统误差是鲁棒控制的 主要目标。1981年加拿大学者Zames首次提出H∞设计思想,它以输入-输出算子的L2范数 作为性能指标。经过30年的发展,H∞理论已成为目前解决系统鲁棒稳定性问题的较成功和 完善的理论体系。另一方面,在稳定性的基础上,实际系统还需满足一定的性能要求,其指 标的具体形式可根据所追求的控制目标来确定。具有广泛工程应用背景的是H2性能指标, 该指标是对系统的瞬态性能、稳态性能以及控制能量约束的综合考虑。统一处理H2/H∞问题 能够兼顾系统的鲁棒性和最优性,因此具有重要的实践意义。

马尔科夫跳变系统的研究具有深刻的实际工程背景,例如在工业过程中经常会出现零件 故障,子系统之间的关联改变,以及突发环境扰动等情况,这些情况会引起系统结构和参数 发生跳变,马尔科夫跳变系统已成为控制工程领域中最基本的动力模型。随着当今计算机技 术的高速发展、受控对象的日益复杂化和工程界对控制要求的日益提高,离散时间随机马尔 科夫跳变系统的控制器设计作为一项具有挑战性的研究课题,近年来受到国内外学者的广泛 关注,理论和应用成果层出不穷,一些研究成果已被成功应用到多个领域,如电力系统、制 造系统、通讯系统、证券投资以及数学金融等。

发明内容

本发明针对一类状态、输入和干扰均依赖噪声的系统,在系统满足能检测时而提出的一 种新的受控随机系统的无限时域鲁棒控制器的控制方法,其能够使得闭环系统既满足鲁棒稳 定性,又具有良好的性能。

其技术解决方案是:

一种受控随机系统的无限时域鲁棒控制器的控制方法,所述受控随机系统为离散时间含 马尔科夫跳的随机乘积噪声受控系统,包含状态方程与输出方程,其中的状态方程为

x(t+1)=A0(rt)x(t)+B0(rt)v(t)+G0(rt)u(t)+Σk=1r[Ak(rt)x(t)+Bk(rt)v(t)+Gk(rt)u(t)]wk(t),---(1)

其中x(·)、u(·)、v(·)分别代表系统的状态、控制输入和外部干扰,{rt,t∈{0,1,2,…}}是齐次马 尔科夫链,状态空间为{1,2,…,N},状态转移概率为p(i,j)=P(rt+1=j|rt=i), {w(t)|w(t)=(w1(t),w2(t),…,wr(t))′,t∈{0,1,2,…}}是相互独立的随机变量序列;输出方程为

Z(t)=C(rt)x(t)D(rt)u(t),---(2)

满足D(rt)′D(rt)=I,I指单位矩阵;

所述无限时域鲁棒控制器的控制方法,包括:

a控制输入u*和最坏外部干扰v*的同步解析步骤,其中u*=K2(rt)x(t),v*=K1(rt)x(t), 是采用耦合矩阵黎卡提方程组的解表出的,具体包括:

结合方程(1)、(2),给出下面的耦合矩阵黎卡提方程组:

X1(i)=Σk=0r[Ak(i)+Gk(i)K2(i)][Σj=1Np(i,j)X1(j)][Ak(i)+Gk(i)K2(i)]+C(i)C(i)+K2(i)K2(i)+K3(i)H1(i)-1K3(i),---(3)

K1(i)=H1(i)-1K3(i),---(4)X2(i)=Σk=0r[Ak(i)+Bk(i)K1(i)][Σj=1Np(i,j)X2(j)][Ak(i)+Bk(i)K1(i)]+C(i)C(i)-K4(i)H2(i)-1K4(i),---(5)

K2(i)=-H2(i)-1K4(i)′,(6)

其中

H1(i)=γ2I-Σk=0rBk(i)[Σj=1Np(i,j)X1(j)]Bk(i),

H2(i)=I+Σk=0rGk(i)[Σj=1Np(i,j)X2(j)]Gk(i),

K3(i)=Σk=0r[Ak(i)+Gk(i)K2(i)][Σj=1Np(i,j)X1(j)]Bk(i),

K4(i)=Σk=0r[Ak(i)+Bk(i)K1(i)][Σj=1Np(i,j)X2(j)]Gk(i).

由于方程(3)、(5)等价于下列形式

X1(i)=Σk=0r[Ak(i)+Gk(i)K2(i)][Σj=1Np(i,j)X1(j)][Ak(i)+Gk(i)K2(i)]+C2(i)C2(i),

X2(i)=Σk=0r[Ak(i)+Bk(i)K1(i)+Gk(i)K2(i)][Σj=1Np(i,j)X2(j)][Ak(i)+Bk(i)K1(i)+Gk(i)K2(i)]+C1(i)C1(i),

这里

C1(rt)=C(rt)H1(rt)-12K2(rt),C2(rt)=C(rt)K2(rt).

考虑到系统的能检测性,可知当v=0,u=u*=K2(rt)x(t)时,系统是渐近均方稳定的。再将 u*=K2(rt)x(t)代入系统方程(1)-(2)中,得到

x(t+1)=[A0(rt)+G0(rt)K2(rt)]x(t)+B0(rt)v(t)+Σk=1r{[Ak(rt)+Gk(rt)K2(rt)]x(t)+Bk(rt)v(t)}wk(t),

Z(t)=C(rt)D(rt)K2(rt)x(t),

因为X1是系统的状态反馈镇定解,故由(3)和上两式,计算可知

Σi=1NP(r0=i)x(0)X1(i)x(0)-Σt=0E{[v(t)-H1(rt)-1K3(rt)x(t)]H1(rt)·[v(t)-H1(rt)-1K3(rt)x(t)]}Σi=1NP(r0=i)x(0)X1(i)x(0),

这表明v*=K1(rt)x(t)是相对于u*的最坏干扰。将v*=K1(rt)x(t)代入系统方程(1)-(2)中, 得到

x(t+1)=[A0(rt)+B0(rt)K1(rt)]x(t)+G0(rt)u(t)+Σk=1r{[Ak(rt)+Bk(rt)K1(rt)]x(t)+Gk(rt)u(t)}wk(t),

Z(t)=C(rt)x(t)D(rt)u(t),

解满足上述方程的标准线性二次最优问题,得到u*=K2(rt)x(t),即

minu(·)J(u,v*)=Σt=0E||z(t)||2=J(u*,v*).

b利用控制输入u*和最坏外部干扰v*进行闭环控制的步骤。

在步骤a中,给定精度ε,并采用迭代方法求得精确解;具体求解步骤如下:

a1任取终端时刻T∈{0,1,2,…},设终端值可以得到 K3T(T+1,i)=0,K4T(T+1,i)=0,H1T(T+1,i)=γ2I,H2T(T+1,i)=I;

a2将和代入下列方程(7)-(10)中, 计算得出和

X1(t,i)=Σk=0r[Ak(i)+Gk(i)K2(t,i)][Σj=1Np(i,j)X1(t+1)][Ak(i)+Gk(i)K2(t,i)]+C(i)C(i)+K2(t,i)K2(t,i)+K3(t+1,i)H1(t+1,i)-1K3(t+1,i),H1(t+1,i)=γ2I-Σk=0rBk(i)[Σj=1Np(i,j)X1(t+1)]Bk(i),X1(T+1,i)=0,---(7)

K1(t,i)=H1(t+1,i)-1K3(t+1,i)′,(8)

X2(t,i)=Σk=0r[Ak(i)+Bk(i)K1(t,i)][Σj=1Np(i,j)X2(t+1)][Ak(i)+Bk(i)K1(t,i)]+C(i)C(i)-K4(t+1,i)H2(t+1,i)-1K4(t+1,i),H2(t+1,i)=I+Σk=0rGk(t,i)[Σj=1Np(i,j)X2(t+1)]Gk(i),X2(T+1,i)=0,---(9)

K2(t,i)=-H2(t+1,i)-1K4(t+1,i)′,(10)

其中

K3(t+1,i)=Σk=0r[Ak(i)+Gk(i)K2(t+1,i)][Σj=1Np(i,j)X1(t+1)]Bk(i),---(11)

K4(t+1,i)=Σk=0r[Ak(i)+Bk(i)K1(t+1,i)][Σj=1Np(i,j)X2(t+1)]Gk(i);---(12)

a3将代入表达式(11)-(12)中, 计算得出和

a4对t=T-1,T-2,…,0,重复第二步和第三步,得到和

a5对T+1重复上述步骤,在t=0时刻计算(7)-(10),得到和

a6估计最大误差若其值小于给定的精度ε,则终止迭代过 程。

本发明能够使得控制器解析表出的控制输入u*同时达到以下指标:

(i)当v=0,u=u*时,系统渐近均方稳定;

(ii)对于给定的干扰抑制水平γ,有||Lu*||=supv0(Σt=0E[||C(rt)x(t)||2+||u*(t)||2])12(Σt=0E||v(t)||2)12<γ;

(iii)当最坏外部干扰v*出现时,u*能够使得输出能量达到最小。

本发明与现有技术相比具有以下优点:

(1)本发明中,控制器形式采用耦合矩阵黎卡提方程组的解表出,通过倒向迭代可得到 反馈增益的解析式,而现有的凸优化方法只能通过求解线性矩阵不等式得到次优控制器。

(2)采用本发明,使得鲁棒控制器能够同时达到上述指标(i)、(ii)和(iii),即所得闭 环系统既保持鲁棒稳定性,又满足能量消耗最小,具有实际应用价值。

附图说明

下面结合附图与具体实施方式对本发明做更进一步的说明:

图1为本发明中运用迭代算法求解耦合矩阵黎卡提方程组的步骤示意图。

图2为采用本发明的一种闭环系统的状态示意图。

图3为本发明所产生的量测输出和对应的能量指标示意图。

图4为仅满足鲁棒H∞稳定性的控制器作用下产生的量测输出和对应的能量指标示意图。

图5为仅满足H2指标的控制器作用下产生的量测输出和对应的能量指标示意图。

具体实施方式

一种受控随机系统的无限时域鲁棒控制器的控制方法,所述受控随机系统考虑为离散时 间含马尔科夫跳的随机乘积噪声受控系统,状态方程为

x(t+1)=A0(rt)x(t)+B0(rt)v(t)+G0(rt)u(t)+Σk=1r[Ak(rt)x(t)+Bk(rt)v(t)+Gk(rt)u(t)]wk(t),---(1)

其中x(·)、u(·)、v(·)分别代表系统的状态、控制输入和外部干扰,{rt,t∈{0,1,2,…}}是齐次马 尔科夫链,状态空间为{1,2,…,N},状态转移概率为p(i,j)=P(rt+1=j|rt=i), {w(t)|w(t)=(w1(t),w2(t),…,wr(t))′,t∈{0,1,2,…}}是相互独立的随机变量序列。系统的输出方 程为

Z(t)=C(rt)x(t)D(rt)u(t),---(2)

满足D(rt)′D(rt)=I,I指单位矩阵;

所述无限时域鲁棒控制器的控制方法,包括:

给定干扰抑制水平γ的步骤;

控制输入u*和最坏外部干扰v*的同步解析步骤,其中u*=K2(rt)x(t),v*=K1(rt)x(t), 是采用耦合矩阵黎卡提方程组的解表出的,具体包括:

结合方程(1)、(2),给出下面的耦合矩阵黎卡提方程组:

X1(i)=Σk=0r[Ak(i)+Gk(i)K2(i)][Σj=1Np(i,j)X1(j)][Ak(i)+Gk(i)K2(i)]+C(i)C(i)+K2(i)K2(i)+K3(i)H1(i)-1K3(i),---(3)

K1(i)=H1(i)-1K3(i)′,(4)

X2(i)=Σk=0r[Ak(i)+Bk(i)K1(i)][Σj=1Np(i,j)X2(j)][Ak(i)+Bk(i)K1(i)]+C(i)C(i)-K4(i)H2(i)-1K4(i),---(5)

K2(i)=-H2(i)-1K4(i)′,(6)

其中

H1(i)=γ2I-Σk=0rBk(i)[Σj=1Np(i,j)X1(j)]Bk(i),

H2(i)=I+Σk=0rGk(i)[Σj=1Np(i,j)X2(j)]Gk(i),

K3(i)=Σk=0r[Ak(i)+Gk(i)K2(i)][Σj=1Np(i,j)X1(j)]Bk(i),

K4(i)=Σk=0r[Ak(i)+Bk(i)K1(i)][Σj=1Np(i,j)X2(j)]Gk(i).

由于方程(3)、(5)等价于下列形式

X1(i)=Σk=0r[Ak(i)+Gk(i)K2(i)][Σj=1Np(i,j)X1(j)][Ak(i)+Gk(i)K2(i)]+C2(i)C2(i),

X2(i)=Σk=0r[Ak(i)+Bk(i)K1(i)+Gk(i)K2(i)][Σj=1Np(i,j)X2(j)][Ak(i)+Bk(i)K1(i)+Gk(i)K2(i)]+C1(i)C1(i),

这里

C1(rt)=C(rt)H1(rt)-12K2(rt),C2(rt)=C(rt)K2(rt).

考虑到系统的能检测性,可知当v=0,u=u*=K2(rt)x(t)时,系统是渐近均方稳定的。再将 u*=K2(rt)x(t)代入系统方程(1)-(2)中,得到

x(t+1)=[A0(rt)+G0(rt)K2(rt)]x(t)+B0(rt)v(t)+Σk=1r{[Ak(rt)+Gk(rt)K2(rt)]x(t)+Bk(rt)v(t)}wk(t),

Z(t)=C(rt)D(rt)K2(rt)x(t),

因为X1是系统的状态反馈镇定解,故由(3)和上两式,计算可知

Σi=1NP(r0=i)x(0)X1(i)x(0)-Σt=0E{[v(t)-H1(rt)-1K3(rt)x(t)]H1(rt)·[v(t)-H1(rt)-1K3(rt)x(t)]}Σi=1NP(r0=i)x(0)X1(i)x(0),

这表明v*=K1(rt)x(t)是相对于u*的最坏干扰。将v*=K1(rt)x(t)代入系统方程(1)-(2)中, 得到

x(t+1)=[A0(rt)+B0(rt)K1(rt)]x(t)+G0(rt)u(t)+Σk=1r{[Ak(rt)+Bk(rt)K1(rt)]x(t)+Gk(rt)u(t)}wk(t),

Z(t)=C(rt)x(t)D(rt)u(t),

解满足上述方程的标准线性二次最优问题,得到u*=K2(rt)x(t),即

minu(·)J(u,v*)=Σt=0E||z(t)||2=J(u*,v*).

利用控制输入u*和最坏外部干扰v*进行闭环控制的步骤。

结合图1,利用上述耦合矩阵黎卡提方程(3)-(6)的具体形式,采用迭代方法能够求 得其精确解。具体求解步骤如下:

第一步,任取终端时刻T∈{0,1,2,…},设终端值可以 得到K3T(T+1,i)=0,K4T(T+1,i)=0,H1T(T+1,i)=γ2I,H2T(T+1,i)=I;

第二步,将和代入下列方程(7)-(10) 中,计算得出和

X1(t,i)=Σk=0r[Ak(i)+Gk(i)K2(t,i)][Σj=1Np(i,j)X1(t+1)][Ak(i)+Gk(i)K2(t,i)]+C(i)C(i)+K2(t,i)K2(t,i)+K3(t+1,i)H1(t+1,i)-1K3(t+1,i),H1(t+1,i)=γ2I-Σk=0rBk(i)[Σj=1Np(i,j)X1(t+1)]Bk(i),X1(T+1,i)=0,---(7)

K1(t,i)=H1(t+1,i)-1K3(t+1,i)′,(8)

X2(t,i)=Σk=0r[Ak(i)+Bk(i)K1(t,i)][Σj=1Np(i,j)X2(t+1)][Ak(i)+Bk(i)K1(t,i)]+C(i)C(i)-K4(t+1,i)H2(t+1,i)-1K4(t+1,i),H2(t+1,i)=I+Σk=0rGk(t,i)[Σj=1Np(i,j)X2(t+1)]Gk(i),X2(T+1,i)=0,---(9)

K2(t,i)=-H2(t+1,i)-1K4(t+1,i)′,(10)

其中

K3(t+1,i)=Σk=0r[Ak(i)+Gk(i)K2(t+1,i)][Σj=1Np(i,j)X1(t+1)]Bk(i),---(11)

K4(t+1,i)=Σk=0r[Ak(i)+Bk(i)K1(t+1,i)][Σj=1Np(i,j)X2(t+1)]Gk(i);---(12)

第三步,将代入表达式(11)-(12) 中,计算得出和

第四步,对t=T-1,T-2,…,0,重复第二步和第三步,得到和

第五步,对T+1重复上述步骤,在t=0时刻计算(7)-(10),得到和

第六步,估计最大误差若其值小于给定的精度ε,则终止迭 代过程。

本发明的效果可通过仿真进一步说明:

假设马尔科夫链的状态空间为{1,2},状态转移概率是p(1,1)=0.2,p(1,2)=0.8,p(2,1)=0.3 和p(2,2)=0.7,系统(1)-(2)的系数矩阵为

A0(1)=0.55000.6,A1(1)=0.4000.45,B0(1)=0.650.45,B1(1)=0.70.5,

G0(1)=0.650.5,G1(1)=0.50.3,A0(2)=0.95000.64,A1(2)=0.75000.5,

B0(2)=0.80.3,B1(2)=0.750.45,G0(2)=0.850.25,G1(2)=0.80.4.

给定干扰抑制水平γ=2.3,精度ε=1×10-4。经过36步迭代后得到耦合矩阵黎卡提方程(3) -(6)的逼近解为

X1(1)=0.40940.48490.48490.7424,X2(1)=0.42610.49600.49600.7623,

X1(2)=0.65740.57000.57000.7703,X2(2)=0.71660.60070.60070.8020,

K1(1)=[0.05760.0723],K2(1)=-[0.31290.3715],

K1(2)=[0.08750.0678],K2(2)=-[0.50600.3335],

最大估计误差||X1(0,2)-X1(0,2)||=1.3718×10-5<ϵ.

对比图3和图4可以看出,给定干扰抑制水平γ=2.3时,本发明提出的控制器设计方法 与单一H∞控制方法虽然都能使所得控制器满足鲁棒稳定性,但是前者引起的能量消耗要小 于后者。对比图3和图5可以看出,单一H2控制方法所得控制器在能量有界的干扰信号下 无法满足给定的H∞指标,也无法镇定系统,闭环系统的量测输出是发散的,能量消耗则趋 于无穷大。

本发明未述及的有关技术内容采取或借鉴已有技术即可实现。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号