首页> 中国专利> 一种切换系统的无模型最优切换方法

一种切换系统的无模型最优切换方法

摘要

本发明公开了一种切换系统的无模型最优切换方法,整个最优切换方法包括迭代关系式的变形、状态数据的处理、近似函数权值的估计和切换策略的更新。迭代关系式在只有初始容许策略应用于系统的情况下进行变形,其中未知量采用基函数权值和的近似形式替代,之后利用状态数据计算迭代关系式中需要的数据矩阵,根据变形后的迭代关系式估计权值并更新切换策略。经过多次迭代计算更新即可获得一个近似的最优切换策略。该方法不需要知道具体的子系统模型,只要状态量可测,便可有效实现切换系统的最优切换调度。

著录项

  • 公开/公告号CN110262235A

    专利类型发明专利

  • 公开/公告日2019-09-20

    原文格式PDF

  • 申请/专利权人 北京理工大学;

    申请/专利号CN201910527858.6

  • 申请日2019-06-18

  • 分类号

  • 代理机构北京理工大学专利中心;

  • 代理人温子云

  • 地址 100081 北京市海淀区中关村南大街5号

  • 入库时间 2024-02-19 14:12:23

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-07-03

    授权

    授权

  • 2019-10-22

    实质审查的生效 IPC(主分类):G05B13/04 申请日:20190618

    实质审查的生效

  • 2019-09-20

    公开

    公开

说明书

技术领域

本发明涉及切换控制系统,具体涉及一种无模型的切换系统最优切换控制方法。

背景技术

切换系统是一类重要而典型的混杂系统,该系统由多个子系统以及特定的切换规则组成,这些切换规则是用来协调各子系统的运行的。

在切换系统控制中,由于不确定性因素的存在,可能难以获得子系统模型或者精确的子系统模型,此时传统的基于模型的方法已经不能解决问题或者难以保证良好的性能。因此,如果在控制过程中不能准确得到系统模型,就需要研究一种不依赖于系统模型的控制方法。

工业过程中产生大量的过程数据,其中包括有价值的状态信息,利用这些在线和离线的数据,可以直接设计控制器、评估性能、做出决策等等。本发明的无模型的控制方法就是利用这些数据替代系统模型来设计控制器。

发明内容

有鉴于此,本发明提供了一种无模型的切换系统最优切换控制方法,能够在切换系统具有连续未知子系统模型的情况下,实现最优切换控制。

为了解决上述技术问题,本发明是这样实现的:

一种切换系统的无模型最优切换方法,该方法包括:

步骤一、对策略迭代中的策略评估迭代关系式进行积分并结合关于初始切换策略所得轨迹相关的代价函数可得迭代关系式的变形,将变形关系式中的未知量利用基函数权值和来表示并忽略逼近误差,得到估计值关系式:

其中,Φ(x)为由一组线性无关的基函数组成的向量,是与Φ(x)对应的权值向量的估计值;x(t)为t时刻的状态量;Ψ(x)为由一组线性无关的基函数组成的向量,是与Ψ(x)对应的权值向量估计值,i表示第i个子系统,V是所有子系统的索引集合;上角标k表示第k次迭代;Q是正定对称函数;是对第k次迭代获得的切换策略v在状态x下的取值的估计;

为了从(I)式求解各未知权值向量估计值,定义与状态有关的数据矩阵:

其中,r=1,2,...l,l是正整数,t1<t2<…<tl是选定的时刻点;

针对难以单独估计的权值向量建立差值的估计公式:

其中,L为正整数且L<l;其中时刻tr满足如下条件且v0(x(tr))=j;i,j∈V且i≠j;

设计切换策略vk+1(x)的估计公式:

步骤二、设置迭代轮次k=0,初始化切换策略v0(x);

步骤三、应用初始化切换策略v0(x)于目标系统并测得状态数据,设置根据公式(II)利用状态数据计算数据矩阵d(tr)和g(tr);

步骤四、对所有的子系统i∈V,根据下式计算权值向量估计并根据式(IV)中k=0情况下的公式计算切换策略估计然后设置k=1;

其中时刻tr满足如下条件v0(x(tr))=i,i∈V;

步骤五、按照下式计算权值向量估计进而按照式(III)为所有的i≠j,i,j∈V,计算

其中时刻tr满足如下条件

步骤六、按照式(IV)中k>0情况下的公式更新切换策略

步骤七、如果则执行步骤八,否则,令k自加1,并返回到步骤五,其中ε是给定的阈值,||·||为欧几里得范数;

步骤八、计算为近似最优代价,为近似最优切换策略。

有益效果:

本发明对迭代关系式进行变形,变形后迭代关系式中的未知量采用基函数权值和的近似形式替代,之后利用状态数据计算迭代关系式中需要的数据矩阵,根据变形后的迭代关系式估计权值并更新切换策略。经过多次迭代计算更新即可获得一个近似的最优切换策略。该方法不需要知道具体的子系统模型,只要状态量可测,便可有效实现切换系统的最优切换调度。

附图说明

图1为本发明流程图。

图2为MATLAB仿真代价函数对比图;

图3为MATLAB仿真切换系统状态轨迹对比图;

图4为MATLAB仿真切换策略对比图。

具体实施方式

下面结合附图并举实施例,对本发明进行详细描述。

本发明提供了一种无模型的切换系统最优切换控制方法,整个最优切换方法包括迭代关系式的变形、状态数据的处理、近似函数权值的估计和切换策略的更新。迭代关系式在只有初始容许策略应用于系统的情况下进行变形,其中未知量采用基函数权值和的近似形式替代,之后利用状态数据计算迭代关系式中需要的数据矩阵,根据变形后的迭代关系式估计权值并更新切换策略。经过多次迭代计算更新即可获得一个近似的最优切换策略。该方法不需要知道具体的子系统模型,只要状态量可测,便可有效实现切换系统的最优切换调度。

考虑如下带有连续时间自治子系统的切换系统:

其中,x(t)∈Rn为系统状态,该状态量是可测的;v∈V代表当前活跃子系统的索引;V={1,2,...,N}是所有子系统的索引集合,N是子系统数量;fv:Rn→Rn是子系统v的模型。x(0)=x0∈Ω是初始状态,是本发明的研究区间,包括原点。

本发明设计最优切换策略使得切换系统(1)在无限时间域代价最小。

为此,需要定义无限时间域代价函数如下:

其中Q:Rn→R是正定对称函数。

在优化过程中,从时刻t的状态x(t)∈Ω开始的系统(1)的代价定义为

且满足:

根据已有文献,给定初始切换策略,可得如下策略迭代方法:

其中上角标的k和k+1均是迭代轮次;vk(x)是第k次迭代获得的切换策略,即切换系统第k次迭代后在状态x下被激活子系统的索引。

从(5)(6)式可以看出,其公式中包含所有子系统模型fi(x)(其中i取V中所有值),当子系统模型已知时,该方法不断迭代地通过策略评估式(5)求解代价并通过策略改进式(6)更新切换策略从而获得切换方案。但对于子系统模型未知的情况,该方案则不适用。

本发明针对子系统模型未知的情况,整个最优切换方法包括迭代关系式的变形、状态数据的处理、近似函数权值的估计和切换策略的更新。下面分别进行具体阐述。

1.迭代关系式的变形。

当子系统模型未知时,本发明为获得初始切换策略,将初始切换策略v0(x)应用于系统,产生大量在线数据,从而用于迭代计算。沿着初始切换策略产生的状态轨迹,可得:

其中δt>0非常小。为了利用初始切换策略产生的状态轨迹数据,对式(5)沿着所得状态轨迹积分并将该积分两侧分别加到式(7)两侧可得:

由于Vk(x)未知,对于所有的状态x∈Ω,本发明采用如下形式替代Vk(x):

其中为由一组线性无关的基函数组成的向量,基函数为Φj(x):Rn→R(j=1,2,...,Nw),是权值向量,是逼近误差。Nw是基函数的数量,取值越大逼近误差越小,当取值足够大时能保证误差逼近于零。一组基函数可以构成一个函数空间的基并几乎可以逼近该函数空间内的任意函数。

当子系统模型fi(x),i∈V未知的情况下,公式(8)中的也未知,本发明将其作为一个整体统一处理,采用如下形式替代

其中为由一组线性无关的基函数组成的向量,基函数为Ψj(x):Rn→R(j=1,2,...,Nc),是权值向量,是逼近误差。Nc是基函数的数量,取值越大逼近误差越小,当取值足够大能保证误差逼近于零。实际应用中Nw和Nc不可能无限大,其相应的Φ(x)和Ψ(x)最好选择不同类型的基函数,或者如果选择同一类型的基函数,则参数、阶数需要不同。

将逼近函数(9)和(10)代入式(8)可得:

其中是逼近误差。考虑到δt非常小,可以认为在时间区间[t,t+δt)内vk(x)和v0(x)保持恒定进而保持恒定,因此忽略逼近误差得到估计关系式:

2.状态数据的处理。

为了从(12)求解各未知权值向量,需要使用所得状态轨迹的大量数据,根据式(12)一些和状态有关的数据矩阵定义如下:

其中t1<t2<…<tl是选定的时刻点,l是正整数,l值越大,采样点越多。r=1,2,...l,d(tr)∈R和

以上数据矩阵满足如下假设:存在正整数和正数α使得对于所有的下列式子成立:

其中时刻tr满足如下条件

其中时刻tr满足如下条件v0(x(tr))=i(i∈V);

其中时刻tr满足如下条件且v0(x(tr))=j(i,j∈V且i≠j)。

3.近似函数权值的估计和切换策略的更新。

由于随着x改变而改变,权值向量不能直接使用数据矩阵从式(12)求解出,接下来我们首先讨论权值的求解。很明显当时,并且(12)可以简化为

利用数据矩阵,可从式(13)获得权值向量的估计如下:

其中时刻tr满足如下条件

接下来我们讨论对权值向量的估计。沿着所得状态轨迹,由(5)式和(10)可得当k=0时:

进而可得估计式如下:

由此可对做如下估计:

其中时刻tr满足如下条件v0(x(tr))=i(i∈V)。

尽管很难估计出权值向量根据式(12)却可以很容易得到对的估计,使用数据矩阵可得如下估计:

其中时刻tr满足如下条件且v0(x(tr))=j(i,j∈V且i≠j)。

对于某个状态x,是不变的,从而有

因此,在式(6)、(17)和(18)的基础上,对切换策略vk+1(x)做如下估计:

且初始切换策略估计为

其中,是第k次迭代获得的切换策略估计值,是对第k次迭代获得的切换策略v在状态x下的取值的估计,该取值即切换系统被激活子系统的索引。

4.无模型在线策略迭代最优切换算法。

在策略迭代方法的基础上,应用上述估计值,可得无模型在线策略迭代最优切换算法如下:

a.设置k=0,初始化切换策略v0(x);

b.应用切换策略v0(x)于目标系统并测得状态数据,设置根据定义利用状态数据为r=1,2,…,L计算数据矩阵d(tr)和g(tr);

c.对所有的子系统i∈V根据式(17)计算权值向量估计并根据式(19)中k=0情况下的公式计算切换策略估计然后设置k=1。

d.按照式(14)计算权值向量估计进而按照式(18)为所有的i≠j(i,j∈V)计算

e.按照式(19)中k>0情况下的公式更新切换策略

f.如果则令并则执行步骤g,否则令k=k+1并返回到步骤d,其中ε是给定的阈值。

g.计算为近似最优代价,为近似最优切换策略。

利用matlab对上述方法进行仿真验证其有效性。考虑具有两个连续自治子系统的切换系统:

系统参数设置为:x(0)=2和Q(x(t))=x2(t)。

目标是寻找最优切换策略使得代价函数最小。根据文献可知,其最优切换策略为

选择初始切换策略为:当x≤1.5时,v0(x)=1;当x>1.5时,v0(x)=2。基函数向量为Φ(x)=[x2,x4,x6,x8,x10]T。采样周期为δt=0.002。应用无模型最优切换方法,使用t=0到t=0.2s的状态数据,经过0.05s内的6次在线迭代,可得近似最优代价和其相对应的近似最优切换策略。

初始切换策略对应的代价近似最优代价和最优代价V*如图2所示,可以看出近似最优代价和最优代价V*相近。图3展示了始终应用初始切换策略v0、在t=0.25s之后应用近似最优切换策略和最优切换策略v*的状态轨迹,其中对应的状态轨迹几乎与v*对应的状态轨迹重合。图4展示了x∈[-2,2]区间上的初始切换策略v0、近似最优切换策略和最优切换策略v*,可以看出近似最优切换策略接近于最优切换策略v*。该仿真验证了所提方法的有效性。

综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号