法律状态公告日
法律状态信息
法律状态
2020-07-03
授权
授权
2019-10-22
实质审查的生效 IPC(主分类):G05B13/04 申请日:20190618
实质审查的生效
2019-09-20
公开
公开
技术领域
本发明涉及切换控制系统,具体涉及一种无模型的切换系统最优切换控制方法。
背景技术
切换系统是一类重要而典型的混杂系统,该系统由多个子系统以及特定的切换规则组成,这些切换规则是用来协调各子系统的运行的。
在切换系统控制中,由于不确定性因素的存在,可能难以获得子系统模型或者精确的子系统模型,此时传统的基于模型的方法已经不能解决问题或者难以保证良好的性能。因此,如果在控制过程中不能准确得到系统模型,就需要研究一种不依赖于系统模型的控制方法。
工业过程中产生大量的过程数据,其中包括有价值的状态信息,利用这些在线和离线的数据,可以直接设计控制器、评估性能、做出决策等等。本发明的无模型的控制方法就是利用这些数据替代系统模型来设计控制器。
发明内容
有鉴于此,本发明提供了一种无模型的切换系统最优切换控制方法,能够在切换系统具有连续未知子系统模型的情况下,实现最优切换控制。
为了解决上述技术问题,本发明是这样实现的:
一种切换系统的无模型最优切换方法,该方法包括:
步骤一、对策略迭代中的策略评估迭代关系式进行积分并结合关于初始切换策略所得轨迹相关的代价函数可得迭代关系式的变形,将变形关系式中的未知量利用基函数权值和来表示并忽略逼近误差,得到估计值关系式:
其中,Φ(x)为由一组线性无关的基函数组成的向量,
为了从(I)式求解各未知权值向量估计值,定义与状态有关的数据矩阵:
其中,r=1,2,...l,l是正整数,t1<t2<…<tl是选定的时刻点;
针对难以单独估计的权值向量
其中,L为正整数且L<l;其中时刻tr满足如下条件
设计切换策略vk+1(x)的估计公式:
步骤二、设置迭代轮次k=0,初始化切换策略v0(x);
步骤三、应用初始化切换策略v0(x)于目标系统并测得状态数据,设置
步骤四、对所有的子系统i∈V,根据下式计算权值向量估计
其中时刻tr满足如下条件v0(x(tr))=i,i∈V;
步骤五、按照下式计算权值向量估计
其中时刻tr满足如下条件
步骤六、按照式(IV)中k>0情况下的公式更新切换策略
步骤七、如果
步骤八、计算
有益效果:
本发明对迭代关系式进行变形,变形后迭代关系式中的未知量采用基函数权值和的近似形式替代,之后利用状态数据计算迭代关系式中需要的数据矩阵,根据变形后的迭代关系式估计权值并更新切换策略。经过多次迭代计算更新即可获得一个近似的最优切换策略。该方法不需要知道具体的子系统模型,只要状态量可测,便可有效实现切换系统的最优切换调度。
附图说明
图1为本发明流程图。
图2为MATLAB仿真代价函数对比图;
图3为MATLAB仿真切换系统状态轨迹对比图;
图4为MATLAB仿真切换策略对比图。
具体实施方式
下面结合附图并举实施例,对本发明进行详细描述。
本发明提供了一种无模型的切换系统最优切换控制方法,整个最优切换方法包括迭代关系式的变形、状态数据的处理、近似函数权值的估计和切换策略的更新。迭代关系式在只有初始容许策略应用于系统的情况下进行变形,其中未知量采用基函数权值和的近似形式替代,之后利用状态数据计算迭代关系式中需要的数据矩阵,根据变形后的迭代关系式估计权值并更新切换策略。经过多次迭代计算更新即可获得一个近似的最优切换策略。该方法不需要知道具体的子系统模型,只要状态量可测,便可有效实现切换系统的最优切换调度。
考虑如下带有连续时间自治子系统的切换系统:
其中,x(t)∈Rn为系统状态,该状态量是可测的;v∈V代表当前活跃子系统的索引;V={1,2,...,N}是所有子系统的索引集合,N是子系统数量;fv:Rn→Rn是子系统v的模型。x(0)=x0∈Ω是初始状态,
本发明设计最优切换策略使得切换系统(1)在无限时间域代价最小。
为此,需要定义无限时间域代价函数如下:
其中Q:Rn→R是正定对称函数。
在优化过程中,从时刻t的状态x(t)∈Ω开始的系统(1)的代价定义为
且满足:
根据已有文献,给定初始切换策略,可得如下策略迭代方法:
其中上角标的k和k+1均是迭代轮次;vk(x)是第k次迭代获得的切换策略,即切换系统第k次迭代后在状态x下被激活子系统的索引。
从(5)(6)式可以看出,其公式中包含所有子系统模型fi(x)(其中i取V中所有值),当子系统模型已知时,该方法不断迭代地通过策略评估式(5)求解代价并通过策略改进式(6)更新切换策略从而获得切换方案。但对于子系统模型未知的情况,该方案则不适用。
本发明针对子系统模型未知的情况,整个最优切换方法包括迭代关系式的变形、状态数据的处理、近似函数权值的估计和切换策略的更新。下面分别进行具体阐述。
1.迭代关系式的变形。
当子系统模型未知时,本发明为获得初始切换策略,将初始切换策略v0(x)应用于系统,产生大量在线数据,从而用于迭代计算。沿着初始切换策略产生的状态轨迹,可得:
其中δt>0非常小。为了利用初始切换策略产生的状态轨迹数据,对式(5)沿着所得状态轨迹积分并将该积分两侧分别加到式(7)两侧可得:
由于Vk(x)未知,对于所有的状态x∈Ω,本发明采用如下形式替代Vk(x):
其中
当子系统模型fi(x),i∈V未知的情况下,公式(8)中的
其中
将逼近函数(9)和(10)代入式(8)可得:
其中
2.状态数据的处理。
为了从(12)求解各未知权值向量,需要使用所得状态轨迹的大量数据,根据式(12)一些和状态有关的数据矩阵定义如下:
其中t1<t2<…<tl是选定的时刻点,l是正整数,l值越大,采样点越多。r=1,2,...l,
以上数据矩阵满足如下假设:存在正整数
其中时刻tr满足如下条件
其中时刻tr满足如下条件v0(x(tr))=i(i∈V);
其中时刻tr满足如下条件
3.近似函数权值的估计和切换策略的更新。
由于
利用数据矩阵,可从式(13)获得权值向量
其中时刻tr满足如下条件
接下来我们讨论对权值向量
进而可得估计式如下:
由此可对
其中时刻tr满足如下条件v0(x(tr))=i(i∈V)。
尽管很难估计出权值向量
其中时刻tr满足如下条件
对于某个状态x,
因此,在式(6)、(17)和(18)的基础上,对切换策略vk+1(x)做如下估计:
且初始切换策略估计为
其中,
4.无模型在线策略迭代最优切换算法。
在策略迭代方法的基础上,应用上述估计值,可得无模型在线策略迭代最优切换算法如下:
a.设置k=0,初始化切换策略v0(x);
b.应用切换策略v0(x)于目标系统并测得状态数据,设置
c.对所有的子系统i∈V根据式(17)计算权值向量估计
d.按照式(14)计算权值向量估计
e.按照式(19)中k>0情况下的公式更新切换策略
f.如果
g.计算
利用matlab对上述方法进行仿真验证其有效性。考虑具有两个连续自治子系统的切换系统:
系统参数设置为:x(0)=2和Q(x(t))=x2(t)。
目标是寻找最优切换策略使得代价函数最小。根据文献可知,其最优切换策略为
选择初始切换策略为:当x≤1.5时,v0(x)=1;当x>1.5时,v0(x)=2。基函数向量为Φ(x)=[x2,x4,x6,x8,x10]T。采样周期为δt=0.002。应用无模型最优切换方法,使用t=0到t=0.2s的状态数据,经过0.05s内的6次在线迭代,可得近似最优代价和其相对应的近似最优切换策略。
初始切换策略对应的代价
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
机译: 非瞬时中断切换系统,不间断中断接收装置,无中断中断切换方法和无中断切换程序
机译: 机器学习模型切换系统,边缘设备,机器学习模型切换方法和程序
机译: 边缘设备机器学习模型切换系统,边缘设备机器学习模型切换方法,程序和边缘设备