首页> 中国专利> 一种时滞非线性多智能体系统的协同追踪控制方法

一种时滞非线性多智能体系统的协同追踪控制方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明提供一种时滞非线性多智能体系统的协同追踪控制方法，针对存在不确定通信的时滞非线性多智能体系统，在实际环境中，多智能体系统之间的局部信息交换往往会受到不确定性的影响，比如网络拓扑的切换及通信链路的间断导致的不可靠通信。本发明通过设计一个有效的分布式控制协议，很好的解决了对于同时存在网络拓扑变换及不可靠通信的环境下的协同追踪一致性问题，从而为实际复杂的民用和军事中的存在不确定通信的复杂系统提供设计指导。

著录项

公开/公告号CN105138006A

专利类型发明专利
公开/公告日2015-12-09

原文格式PDF
申请/专利权人哈尔滨工程大学;
展开▼

申请/专利号CN201510400439.8
发明设计人赵春晖;崔冰;齐滨;冯驰;马铁东;
展开▼

申请日2015-07-09
分类号G05D1/10(20060101);
代理机构
代理人
地址 150001 黑龙江省哈尔滨市南岗区南通大街145号哈尔滨工程大学科技处知识产权办公室
入库时间 2023-12-18 12:40:40

法律信息

法律状态公告日

法律状态信息

法律状态
2017-08-04

授权

授权
2016-01-06

实质审查的生效 IPC(主分类):G05D1/10 申请日:20150709

实质审查的生效
2015-12-09

公开

公开

说明书

技术领域

本发明涉及多智能体系统协同控制技术领域，尤其涉及一种时滞非线性多智能体系统的协同追踪控制方法。

背景技术

在最近的二十年里，关于多智能体系统的协同一致性的研究得到很多学者的关注。在众多的工程应用领域里有着广泛的研究，比如多机器人系统，传感器网络的协调控制，无人机编队飞行以及多目标探索等。目前关于协同一致性的研究，主要针对与两种控制问题：协同镇定问题和协同追踪问题。协同镇定问题依赖于系统内所有智能体的状态趋近与一个常值，该常值依赖于所有智能体的初始状态。协同追踪问题也可以成为基于领航者的协同一致问题，在实际中，基于领航者的多智能体系统可以拓宽其应用领域，能够使跟随者追踪到领航者的状态，从而可以通过控制领航者的状态变化来调整整个多智能体系统。

本发明研究基于领航者的多智能体系统的协同一致问题。近年来，关于此问题，国内外学者进行了大量的研究，并且得到许多重要的结果。这些研究成果主要基于非线性多智能体系统具有固定的网络拓扑，并且在多智能体之间的通信是在理想条件下实现的，即不会受到外界环境影响从而导致通信间断。但在实际中，很多物理系统中具有时滞非线性部分，并且在众多复杂的实际应用(多机器人的协调运动、无人机的编队飞行等)中，多智能体系统的网络拓扑需要进行定时的切换，从而实现不同的控制目的，此时多智能体系统的协同追踪一致问题就会变得复杂很多。另一方面在控制过程中，多智能体系统还会受到复杂的环境影响，有可能由于通信丢包、通信受阻等不可靠通信下影响导致通信间断。因此，在真实的实际环境中，基于可变网络拓扑的时滞非线性多智能体系统中，在不确定通信条件下，设计有效地分布式控制协议使其实现协同追踪一致性具有很大的挑战性。

综上所述，在对于带有领航者的时滞非线性多智能体系统，研究由于不确定通信条件下(即同时考虑可切换的网络拓扑及不可靠通信的条件下)，如何设计有效地控制协议从而保证整个系统协同追踪一致性的问题，在该领域内还是一研究盲点，关于此问题的研究对实际应用有着重要的指导作用及应用前景。

发明内容

本发明的目的是为了解决在有不确定通信条件下的时滞非线性多智能体系统的协同追踪一致性的问题而提供一种时滞非线性多智能体系统的协同追踪控制方法，。

本发明的目的是这样实现的：非线性多智能体系统由一个领航者和N个跟随者组成，第i个跟随者的动态模型是：

${\overset{\cdot}{x}}_{i} (t) = {Ax}_{i} (t) + C f (x_{i} (t)) + D f (x_{i} (t - τ (t))) + {Bu}_{i} (t), i = 1, ..., N$

其中，分别表示第i个跟随者的n维状态向量、m维非线性动态函数向量、p维控制输入向量，是实数集，τ(t)是未知时滞，和是已知系统矩阵，

领航者的动态模型是：

${\overset{\cdot}{x}}_{0} (t) = {Ax}_{0} (t) + C f (x_{0} (t)) + D f (x_{0} (t - τ (t)))$

其中是领航者状态变量；

所述协同追踪控制方法包括如下步骤：

步骤一：确定系统反馈增益矩阵K：

K＝B^TS^-1

其中，S是正定矩阵，S满足下列四个线性矩阵不等式成立：

$(\begin{matrix} A S + {SA}^{T} - {μBB}^{T} + {CZ}_{1} C^{T} + {DZ}_{2} D^{T} + α_{1} S & ρ S \\ ρ S & - Z_{1} \end{matrix}) < 0$

$(\begin{matrix} - β_{1} S & ρ S \\ ρ S & - Z_{2} \end{matrix}) < 0$

$(\begin{matrix} A S + {SA}^{T} + {CZ}_{1}^{'} C^{T} + {DZ}_{2}^{'} D^{T} - α_{2} S & ρ S \\ ρ S & - Z_{1}^{'} \end{matrix}) < 0$

$(\begin{matrix} - β_{2} S & ρ S \\ ρ S & - Z_{2}^{'} \end{matrix}) < 0$

其中，ρ是使所有跟随者的非线性动态函数f(x_i(t))满足的非负常数，其中为任意两个n维向量，Z₁、Z₂和Z'₁、Z'₂是正定对称矩阵，常数μ＞0、α₁＞β₁≥0、α₂＞0、β₂＞0；

步骤二：确定系统控制增益系数c：

$c > \frac{{μp}_{1}}{λ_{0}}$

式中，其中，σ(t)是分段常值的信息交互图切换信号，满足 ${[p_{1}^{σ (t)}, ..., p_{i}^{σ (t)}, ..., p_{N}^{σ (t)}]}^{T} = {(L_{σ (t)} + G_{σ (t)})}^{- T} 1_{N},$ L_σ(t)是t时刻跟随者的Laplacian矩阵，其中是指向第i个跟随者的其他跟随者的个数，是t时刻跟随者的信息交互图边上的权值； $G_{σ (t)} = diag {g_{i}^{σ (t)}},$ 是t时刻领航者与第i个跟随者的权值；1_N为N维均为1的列向量；λ₀是矩阵Q_σ(t)的最小特征值，Q_σ(t)＝P_σ(t)(L_σ(t)+G_σ(t))+(L_σ(t)+G_σ(t))^TP_σ(t)，

步骤三：确定系统最小通信率

其中，Γ_k＝t_k+1-t_k是时间间隔[t_k,t_k+1)，t_k是切换时间点；是信息通信时间，是通信间断点；其中τ_m是未知时滞τ(t)的上限，γ₂＝α₂+β₂，κ₁＝max{p₁,1}， $κ_{2} = m a x {e^{γ_{1} τ_{m}}, κ_{3}},$ 其中 $κ_{3} = m a x {\frac{1}{p_{0}}, 1}, p_{0} = m i n {p_{i}^{σ (t)}}, i \in {1, ..., N};$

步骤四：确定分布式控制器u_i(t)：

其中系统反馈增益矩阵K和系统控制增益系数c分别为步骤一和步骤二所求；

步骤五：协同追踪一致：

在满足步骤三所得到的最小通信率的基础上，将分布式控制器u_i(t)输入到第i个跟随者的动态模型中，使所有跟随者的状态向量趋于领航者的状态向量，lim_t→∞||x_i(t)-x₀(t)||＝0，i＝1,...,N。

本发明还包括这样一些结构特征：

1.步骤二中的表示第i个跟随者不能够观测或接收到第j个跟随者的状态信息，表示第i个跟随者能够观测或接收到第j个跟随者的状态信息，也说明第j个跟随者的状态信息是第i个跟随者的邻居信息。

2.步骤二中的表示第i个跟随者能够观测或接收到领航者的状态信息。

与现有技术相比，本发明的有益效果是：本发明是基于一个领航者的协同一致性问题，针对复杂的网络环境，提出了一种有效地分布式控制协议。本发明考虑了基于领航者-跟随者的时滞非线性多智能体系统，在时变的网络拓扑及不可靠通信同时存在的情况下，设计有效的分布式控制协议，给出解决协同追踪一致问题的充分条件，本发明充分考虑了实际应用中所遇到复杂多变的工程环境，具有很强的实用性，从而为实际复杂的民用和军事中的存在不确定通信的系统对象提供设计指导。

附图说明

图1是本发明的系统流程图；

图2是网络拓扑切换及通信间断点示意图；

图3(a)是仿真多智能体系统网络拓扑图3(b)是仿真多智能体系统网络拓扑

图4(a)是分布式控制协议作用下的五个跟随者和一个领航者的状态轨迹中的第一个状态分量x_i1，图4(b)是分布式控制协议作用下的五个跟随者和一个领航者的状态轨迹中的第二个状态分量x_i2；

图5是分布式控制协议作用下的追踪误差图。

具体实施方式

下面结合附图与具体实施方式对本发明作进一步详细描述。

本发明考虑由一个领航者和N个跟随者组成的非线性多智能体系统，通过设计分布式控制器，使N个跟随者的状态最终趋近于领航者的状态。

对于跟随者，第i个跟随者的动态模型为

${\overset{\cdot}{x}}_{i} (t) = {Ax}_{i} (t) + C f (x_{i} (t)) + D f (x_{i} (t - τ (t))) + {Bu}_{i} (t), i = 1, ..., N$

其中是n维状态向量，为实数集；是其非线性动态函数；τ(t)是未知时滞；u_i(t)是控制输入；是已知系统矩阵。

领航者的动态模型为

${\overset{\cdot}{x}}_{0} (t) = {Ax}_{0} (t) + C f (x_{0} (t)) + D f (x_{0} (t - τ (t)))$

其中为领航者状态变量。本发明中的领航者可以作为一个外在系统或者是控制发生器，可以产生所需要的状态轨迹，并且领航者不会被跟随者所影响，只是给跟随者提供追踪状态信息。

本发明的控制目的是对于跟随者和领航者的多智能体系统，对每个跟随者设计分布式控制协议，使跟随者的状态最终渐进趋向领航者的状态，即lim_t→∞||x_i(t)-x₀(t)||＝0，i＝1,...,N。

结合图1，图中显示了本发明的流程图，由流程图可以看出，概括为如下部分：

第一部分：确定系统控制增益系数及反馈增益矩阵

统控制增益系数和反馈增益矩阵用线性矩阵不等式的形式给出求解条件，其中线性矩阵不等式的求解可以使用MatlabLMI工具箱进行求解。

在每个可能的切换拓扑都存在一个生成树，并且领航者所在的节点为根节点，并且跟随者的非线性动态函数f(x_i(t))满足设计正定对称矩阵Z₁，Z₂和Z'₁，Z'₂；选择常数μ＞0，α₁＞β₁≥0，α₂＞0，β₂＞0及正定矩阵S使以下四个线性矩阵不等式成立：

$(\begin{matrix} A S + {SA}^{T} - {μBB}^{T} + {CZ}_{1} C^{T} + {DZ}_{2} D^{T} + α_{1} S & ρ S \\ ρ S & - Z_{1} \end{matrix}) < 0$

$(\begin{matrix} - β_{1} S & ρ S \\ ρ S & - Z_{2} \end{matrix}) < 0$

$(\begin{matrix} A S + {SA}^{T} + {CZ}_{1}^{'} C^{T} + {DZ}_{2}^{'} D^{T} - α_{2} S & ρ S \\ ρ S & - Z_{1}^{'} \end{matrix}) < 0$

$(\begin{matrix} - β_{2} S & ρ S \\ ρ S & - Z_{2}^{'} \end{matrix}) < 0$

在拓扑下，是σ(t)所在跟随者信息交互图边上的权值，指向节点i边的个数(即入度)为定义入度矩阵邻接矩阵Laplacian矩阵定义 $p_{σ (t)} = {[p_{1}^{σ (t)}, ..., p_{N}^{σ (t)}]}^{T} = {(L_{σ (t)} + G_{σ (t)})}^{- T} 1_{N},$ Q_σ(t)＝P_σ(t)(L_σ(t)+G_σ(t))+(L_σ(t)+G_σ(t))^TP_σ(t)，其中1_N为N维均为1的列向量。

设计反馈矩阵K＝B^TS^-1，并且选择控制增益其中λ₀是矩阵Q_σ(t)的最小特征值。

第二部分：确定系统最小通信率

结合图2，定义t_k，为拓扑切换时间点及为通信间断点，为自然数集。在每一个时间间隔[t_k,t_k+1)，内，网络拓扑是固定的，即如图2所示，[t₀,t₁)内为拓扑[t₁,t₂)内为拓扑[t₂,t₃)内为拓扑并且在每一个拓扑间隔[t_k,t_k+1)内，均存在着不同大小的通信间断时间，即定义σ(t)是拓扑切换信号，并且每段拓扑内的通信时间为每段拓扑时间Γ_k＝t_k+1-t_k及每段通信率确定了系统网络拓扑的切换时间及通信时间，并且给出系统所需的最小通信率。

所述未知时滞τ(t)有界并且τ(t)≤τ_m，并且在每个时间间隔[t_k,t_k+1)内，确定该系统的最小通信率：

其中 $γ_{1} = α_{1} - β_{1} e^{γ_{1} τ_{m}},$ γ₂＝α₂+β₂， $κ_{1} = m a x {\frac{1}{p_{0}}, 1},$ κ₂＝max{p₁,1}， $κ_{3} = m a x {e^{γ_{1} τ_{m}}, κ_{1}},$ $p_{0} = m i n {p_{i}^{σ (t)}}, i \in {1, ..., N} .$

第三部分：确定分布式控制器

设计出有效合理的分布式状态反馈控制器，并且每个智能体的控制协议设计只需知道自己的邻居信息，而不需要知道全局信息，针对本发明的控制目的确定分布式控制器是：

其中c和K分别为步骤2所求；是领航者与跟随者的信息权值；表示跟随者(智能体)i能够观测或接收到智能体j和领航者的状态信息，能被跟随者i直接观测到的智能体j即为跟随者i的邻居节点。针对控制器，第i个跟随者与邻居跟随者之间只在进行信息交换，并且只需知道其邻居跟随者的状态x_j(t)与自身跟随者的状态x_i(t)的差值，如果该跟随者还能得到领航者的状态信息x₀(t)与自身状态的差值。

第四部分：协同追踪一致

基于步骤3和步骤4，将控制器模型输入到跟随者动态系统中，从而使所有跟随者的状态趋于领航者的状态，实现完成本发明的控制目的。

本发明的效果可以通过以下仿真验证：

仿真内容：考虑由五个跟随者(智能体)和一个领航者组成的多智能体系统，其系统矩阵为 $A = (\begin{matrix} - 1 & 0 \\ 0 & - 1 \end{matrix}), C = (\begin{matrix} 1 + π / 4 & 20 \\ 0.1 & 1 + π / 4 \end{matrix}), D = (\begin{matrix} - 1.3 \sqrt{2} π / 4 & 0.1 \\ 0.1 & - 1.3 \sqrt{2} π / 4 \end{matrix}), B = (\begin{matrix} 1 & 0 \\ 0 & 1 \end{matrix}),$ 非线性函数f(x_i(t))＝(|x_ij(t)+1|-|x_ij(t)-1|)/2，i＝0,1,2,3,4,5，j＝1,2，未知时滞τ(t)＝tanh(t)＜τ_m＝1。根据可知ρ＝1。

本发明中跟随者间的信息交互图在与中切换，如图3(a)和图3(b)所示，设定每一段的时间间隔为3.3s，即t∈[t_k,t_k+3.3)s，t∈[t_k+3.3,t_k+1)，通过步骤1，可以得出 $S = (\begin{matrix} 0.0810 & - 0.0177 \\ - 0.0177 & 0.0665 \end{matrix}),$ μ＝8.2160，α₁＝20，β₁＝0.12，α₂＝26.3156，β₂＝2.5及 $Z_{1} = (\begin{matrix} 2.9815 & - 0.3040 \\ - 0.3040 & 0.0394 \end{matrix}), Z_{2} = (\begin{matrix} 0.7917 & 0.0952 \\ 0.0952 & 1.2689 \end{matrix}), Z_{1}^{'} = (\begin{matrix} 6.6061 & - 0.5609 \\ - 0.5609 & 0.0510 \end{matrix}),$ $Z_{2}^{'} = (\begin{matrix} 0.2007 & - 0.0502 \\ - 0.0502 & 0.0382 \end{matrix}),$ 从而可以得到c＝21.2和 $K = (\begin{matrix} 13.0984 & 3.4821 \\ 3.4821 & 15.9585 \end{matrix});$ 通过步骤2，控制目的达成所需最小通信率应该大于0.9131，本仿真中我们选择0.92。

图4(a)、图4(b)给出了五个跟随者与领航者的状态轨迹；根据追踪误差图5给出了五个追随者与领航者的追踪误差。结合图4(a)、图4(b)与图5，可以得出在本发明提出的控制器下，协同追踪一致的问题得到解决。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种时滞非线性多智能体系统的协同追踪控制方法 [P] . 中国专利： CN105138006B . 2017.08.04
2. 一种非线性混合阶多智能体机电系统事件触发协同控制方法 [P] . 中国专利： CN113703315A . 2021-11-26
3. SPATIAL DISTRIBUTION CONTROL METHOD OF SMELL, SPATIAL DISTRIBUTION CONTROLLER OF SMELL, AUDIOVISUAL SYSTEM AND CUSTOMER GUIDANCE SYSTEM [P] . 日本专利： JP2012047355A . 2012-03-08

机译：智能体的空间分布控制方法，智能体的空间分布控制器，视听系统和顾客指导系统
4. Vehicle tracking system-a smart way to remotely control the theft vehicle [P] . IN2014CH01318A . 2015-09-18

机译：车辆追踪系统-一种远程控制盗窃车辆的智能方式
5. Vehicle fault diagnosis system and related methods of cooperative multi-agent formula [P] . 日本专利： JP5746420B2 . 2015-07-08

机译：车辆故障诊断系统及协同多智能体公式的相关方法