法律状态公告日
法律状态信息
法律状态
2017-08-04
授权
授权
2016-01-06
实质审查的生效 IPC(主分类):G05D1/10 申请日:20150709
实质审查的生效
2015-12-09
公开
公开
技术领域
本发明涉及多智能体系统协同控制技术领域,尤其涉及一种时滞非线性多智能体系统的协同追踪控制方法。
背景技术
在最近的二十年里,关于多智能体系统的协同一致性的研究得到很多学者的关注。在众多的工程应用领域里有着广泛的研究,比如多机器人系统,传感器网络的协调控制,无人机编队飞行以及多目标探索等。目前关于协同一致性的研究,主要针对与两种控制问题:协同镇定问题和协同追踪问题。协同镇定问题依赖于系统内所有智能体的状态趋近与一个常值,该常值依赖于所有智能体的初始状态。协同追踪问题也可以成为基于领航者的协同一致问题,在实际中,基于领航者的多智能体系统可以拓宽其应用领域,能够使跟随者追踪到领航者的状态,从而可以通过控制领航者的状态变化来调整整个多智能体系统。
本发明研究基于领航者的多智能体系统的协同一致问题。近年来,关于此问题,国内外学者进行了大量的研究,并且得到许多重要的结果。这些研究成果主要基于非线性多智能体系统具有固定的网络拓扑,并且在多智能体之间的通信是在理想条件下实现的,即不会受到外界环境影响从而导致通信间断。但在实际中,很多物理系统中具有时滞非线性部分,并且在众多复杂的实际应用(多机器人的协调运动、无人机的编队飞行等)中,多智能体系统的网络拓扑需要进行定时的切换,从而实现不同的控制目的,此时多智能体系统的协同追踪一致问题就会变得复杂很多。另一方面在控制过程中,多智能体系统还会受到复杂的环境影响,有可能由于通信丢包、通信受阻等不可靠通信下影响导致通信间断。因此,在真实的实际环境中,基于可变网络拓扑的时滞非线性多智能体系统中,在不确定通信条件下,设计有效地分布式控制协议使其实现协同追踪一致性具有很大的挑战性。
综上所述,在对于带有领航者的时滞非线性多智能体系统,研究由于不确定通信条件下(即同时考虑可切换的网络拓扑及不可靠通信的条件下),如何设计有效地控制协议从而保证整个系统协同追踪一致性的问题,在该领域内还是一研究盲点,关于此问题的研究对实际应用有着重要的指导作用及应用前景。
发明内容
本发明的目的是为了解决在有不确定通信条件下的时滞非线性多智能体系统的协同追踪一致性的问题而提供一种时滞非线性多智能体系统的协同追踪控制方法,。
本发明的目的是这样实现的:非线性多智能体系统由一个领航者和N个跟随者组成,第i个跟随者的动态模型是:
其中,分别表示第i个跟随者的n维状态向量、m维非线性动态函数向量、p维控制输入向量,是实数集,τ(t)是未知时滞,和是已知系统矩阵,
领航者的动态模型是:
其中是领航者状态变量;
所述协同追踪控制方法包括如下步骤:
步骤一:确定系统反馈增益矩阵K:
K=BTS-1
其中,S是正定矩阵,S满足下列四个线性矩阵不等式成立:
其中,ρ是使所有跟随者的非线性动态函数f(xi(t))满足的非负常数,其中为任意两个n维向量,Z1、Z2和Z'1、Z'2是正定对称矩阵,常数μ>0、α1>β1≥0、α2>0、β2>0;
步骤二:确定系统控制增益系数c:
式中,其中,σ(t)是分段常值的信息交互图切换信号,满足
步骤三:确定系统最小通信率
其中,Γk=tk+1-tk是时间间隔[tk,tk+1),tk是切换时间点;是信息通信时间,是通信间断点;其中τm是未知时滞τ(t)的上限,γ2=α2+β2,κ1=max{p1,1},
步骤四:确定分布式控制器ui(t):
其中系统反馈增益矩阵K和系统控制增益系数c分别为步骤一和步骤二所求;
步骤五:协同追踪一致:
在满足步骤三所得到的最小通信率的基础上,将分布式控制器ui(t)输入到第i个跟随者的动态模型中,使所有跟随者的状态向量趋于领航者的状态向量,limt→∞||xi(t)-x0(t)||=0,i=1,...,N。
本发明还包括这样一些结构特征:
1.步骤二中的表示第i个跟随者不能够观测或接收到第j个跟随者的状态信息,表示第i个跟随者能够观测或接收到第j个跟随者的状态信息,也说明第j个跟随者的状态信息是第i个跟随者的邻居信息。
2.步骤二中的表示第i个跟随者能够观测或接收到领航者的状态信息。
与现有技术相比,本发明的有益效果是:本发明是基于一个领航者的协同一致性问题,针对复杂的网络环境,提出了一种有效地分布式控制协议。本发明考虑了基于领航者-跟随者的时滞非线性多智能体系统,在时变的网络拓扑及不可靠通信同时存在的情况下,设计有效的分布式控制协议,给出解决协同追踪一致问题的充分条件,本发明充分考虑了实际应用中所遇到复杂多变的工程环境,具有很强的实用性,从而为实际复杂的民用和军事中的存在不确定通信的系统对象提供设计指导。
附图说明
图1是本发明的系统流程图;
图2是网络拓扑切换及通信间断点示意图;
图3(a)是仿真多智能体系统网络拓扑图3(b)是仿真多智能体系统网络拓扑
图4(a)是分布式控制协议作用下的五个跟随者和一个领航者的状态轨迹中的第一个状态分量xi1,图4(b)是分布式控制协议作用下的五个跟随者和一个领航者的状态轨迹中的第二个状态分量xi2;
图5是分布式控制协议作用下的追踪误差图。
具体实施方式
下面结合附图与具体实施方式对本发明作进一步详细描述。
本发明考虑由一个领航者和N个跟随者组成的非线性多智能体系统,通过设计分布式控制器,使N个跟随者的状态最终趋近于领航者的状态。
对于跟随者,第i个跟随者的动态模型为
其中是n维状态向量,为实数集;是其非线性动态函数;τ(t)是未知时滞;ui(t)是控制输入;是已知系统矩阵。
领航者的动态模型为
其中为领航者状态变量。本发明中的领航者可以作为一个外在系统或者是控制发生器,可以产生所需要的状态轨迹,并且领航者不会被跟随者所影响,只是给跟随者提供追踪状态信息。
本发明的控制目的是对于跟随者和领航者的多智能体系统,对每个跟随者设计分布式控制协议,使跟随者的状态最终渐进趋向领航者的状态,即limt→∞||xi(t)-x0(t)||=0,i=1,...,N。
结合图1,图中显示了本发明的流程图,由流程图可以看出,概括为如下部分:
第一部分:确定系统控制增益系数及反馈增益矩阵
统控制增益系数和反馈增益矩阵用线性矩阵不等式的形式给出求解条件,其中线性矩阵不等式的求解可以使用MatlabLMI工具箱进行求解。
在每个可能的切换拓扑都存在一个生成树,并且领航者所在的节点为根节点,并且跟随者的非线性动态函数f(xi(t))满足设计正定对称矩阵Z1,Z2和Z'1,Z'2;选择常数μ>0,α1>β1≥0,α2>0,β2>0及正定矩阵S使以下四个线性矩阵不等式成立:
在拓扑下,是σ(t)所在跟随者信息交互图边上的权值,指向节点i边的个数(即入度)为定义入度矩阵邻接矩阵Laplacian矩阵定义
设计反馈矩阵K=BTS-1,并且选择控制增益其中λ0是矩阵Qσ(t)的最小特征值。
第二部分:确定系统最小通信率
结合图2,定义tk,为拓扑切换时间点及为通信间断点,为自然数集。在每一个时间间隔[tk,tk+1),内,网络拓扑是固定的,即如图2所示,[t0,t1)内为拓扑[t1,t2)内为拓扑[t2,t3)内为拓扑并且在每一个拓扑间隔[tk,tk+1)内,均存在着不同大小的通信间断时间,即定义σ(t)是拓扑切换信号,并且每段拓扑内的通信时间为每段拓扑时间Γk=tk+1-tk及每段通信率确定了系统网络拓扑的切换时间及通信时间,并且给出系统所需的最小通信率。
所述未知时滞τ(t)有界并且τ(t)≤τm,并且在每个时间间隔[tk,tk+1)内,确定该系统的最小通信率:
其中
第三部分:确定分布式控制器
设计出有效合理的分布式状态反馈控制器,并且每个智能体的控制协议设计只需知道自己的邻居信息,而不需要知道全局信息,针对本发明的控制目的确定分布式控制器是:
其中c和K分别为步骤2所求;是领航者与跟随者的信息权值;表示跟随者(智能体)i能够观测或接收到智能体j和领航者的状态信息,能被跟随者i直接观测到的智能体j即为跟随者i的邻居节点。针对控制器,第i个跟随者与邻居跟随者之间只在进行信息交换,并且只需知道其邻居跟随者的状态xj(t)与自身跟随者的状态xi(t)的差值,如果该跟随者还能得到领航者的状态信息x0(t)与自身状态的差值。
第四部分:协同追踪一致
基于步骤3和步骤4,将控制器模型输入到跟随者动态系统中,从而使所有跟随者的状态趋于领航者的状态,实现完成本发明的控制目的。
本发明的效果可以通过以下仿真验证:
仿真内容:考虑由五个跟随者(智能体)和一个领航者组成的多智能体系统,其系统矩阵为
本发明中跟随者间的信息交互图在与中切换,如图3(a)和图3(b)所示,设定每一段的时间间隔为3.3s,即t∈[tk,tk+3.3)s,t∈[tk+3.3,tk+1),通过步骤1,可以得出
图4(a)、图4(b)给出了五个跟随者与领航者的状态轨迹;根据追踪误差图5给出了五个追随者与领航者的追踪误差。结合图4(a)、图4(b)与图5,可以得出在本发明提出的控制器下,协同追踪一致的问题得到解决。
机译: 智能体的空间分布控制方法,智能体的空间分布控制器,视听系统和顾客指导系统
机译: 车辆追踪系统-一种远程控制盗窃车辆的智能方式
机译: 车辆故障诊断系统及协同多智能体公式的相关方法