首页> 中国专利> 基于分布式演化博弈的模型预测无领导者编队控制方法

基于分布式演化博弈的模型预测无领导者编队控制方法

摘要

本发明提出了一种基于分布式演化博弈的模型预测无领导者编队控制方法,能够解决leader‑follower编队控制算法中的缺点。本发明采用了无领导者的编队控制算法,即所有智能体都具有相同的角色和功能,并且利用模型预测控制算法为构建全局优化问题,通过在全局模型预测成本函数中设计一个编队误差函数,来实现编队的目的。避碰功能的实现是通过利用Voronoi图为每个智能体构建安全距离集,通过将编队控制问题转变成为演化博弈问题,来实现分布式求解,同时利用演化博弈中的不变集的性质来保证每个智能体在移动的过程中不会发生碰撞。此外,本发明对于时变的通信网络也同样适用,在提高了控制性能和安全性能的同时,降低了计算的复杂程度,减少了通信负担。

著录项

  • 公开/公告号CN115616913A

    专利类型发明专利

  • 公开/公告日2023-01-17

    原文格式PDF

  • 申请/专利权人 北京理工大学;

    申请/专利号CN202211320956.0

  • 申请日2022-10-26

  • 分类号G05B13/04(2006.01);

  • 代理机构北京正阳理工知识产权代理事务所(普通合伙) 11639;

  • 代理人周蜜

  • 地址 100081 北京市海淀区中关村南大街5号

  • 入库时间 2023-06-19 18:21:03

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-02-10

    实质审查的生效 IPC(主分类):G05B13/04 专利申请号:2022113209560 申请日:20221026

    实质审查的生效

  • 2023-01-17

    公开

    发明专利申请公布

说明书

技术领域

本发明属于多智能体编队控制技术领域,具体涉及一种基于分布式演化博弈的模型预测无领导者编队控制方法。

背景技术

近些年,随着多智能体系统的不断发展,编队控制成为了当前多智能体系统研究的热点问题。编队控制是指多个智能体如无人车、无人机在朝着目标位置移动的过程中,相互之间能保期望的位置,同时又要适应环境约束(如避开障碍物)。它能够实现在无人工参与的情况下完成特定复杂的任务,因而在军事、航天、工业等各个领域得到了广泛的应用,具有良好的发展前景。但是,在实际应用中,多智能体编队控制的一个难点问题是,所有智能体必须具有与障碍物或者其他智能体避碰能力,且在智能体移动过程中通信拓扑可能是时变的。另外,当采用分布式的方式形成某种编队时,每个智能体都需要知道其他智能体的状态,但是当通信拓扑发生改变时,该智能体间的通信可能不存在。

leader-follower控制方法作为解决当前编队控制问题的一种方法,其基本原理为将其中一个智能体作为领队以跟踪参考轨迹,其他的智能体作为跟随者与领队保持一定的距离,从而实现编队控制的目的。因其原理简单被广泛应用到多智能体编队中,但是leader-follower编队问题中存以下两个缺点:1)整个系统过于依赖领队,当领队无法跟踪参考轨迹时,整个多智能体编队都会偏离参考轨迹;2)leader智能体没有将follower智能体的编队跟随情况考虑在内,可能会出现leader智能体移动过快,follower智能体跟不上这种情况出现。

发明内容

有鉴于此,本发明提供了一种基于分布式演化博弈的分布式模型预测无领导者编队控制方法,所有智能体具有相同的角色和功能,并且能够实现在受到通讯约束的条件下,每个智能体只需要获得邻居的局部信息就可以无碰撞形成编队。

为实现上述目的,本发明一种基于分布式演化博弈的分布式模型预测无领导者编队控制方法,包括以下步骤:

步骤1,建立多智能体系统,明确智能体的初始位置及目标位置,构建智能体的动力学模型,多智能体之间的避障约束、智能体的控制约束以及状态约束的最优控制问题;所述优化问题是最终目标状态已知情况下,通过预测模型来预测未来一段时间内智能体的状态,使未来一段时间内智能体的位置和目标位置距离最小,获得当前时刻最优控制输入量;

步骤2,为每个智能体创建安全距离集,保证每个智能体只要在规定的安全距离集中移动时不会发生碰撞;

步骤3,提出受耦合约束的两种群演化博弈,选择修正协议构建演化动力学方程,使得每个种群的演化动力学方程经过不断的迭代和优化能达到博弈的纳什均衡解,并且具有不变集的性质;

步骤4,将所构建的多智能体编队问题转变成为受耦合约束的两种群演化博弈问题,利用演化博弈的演化动力学方程来对多智能体编队优化问题进行求解。

其中,所述步骤4中,将编队控制中的智能体位置转变成为演化博弈中的种群状态,将编队控制中的各个智能体转变成为演化博弈中的策略,将编队控制问题中的代价函数和演化博弈的效益函数相结合,进而利用演化动力学方程对步骤1中的最优控制问题进行求解。

其中,所述步骤1中的优化问题为:

min

s.t.form=0,1,…,H

其中:

其中,所述步骤2中的安全距离集的定义为:

其中,R为规定的安全距离,集合

其中,所述步骤2中采用具有耦合约束的两个种群的分布式进化博弈,具体步骤为:通过寻找纳什平衡点进行进化博弈的优化问题求解;将寻找纳什平衡点求解的优化问题代入到平均动力学,得到具有耦合约束的两个种群的分布史密斯动力学方程。

有益效果:

1、本发明将演化博弈中的平均动力学推广到两个种群间的耦合约束条件下,并证明了该演化动力学经过不断的迭代和优化最终会达到博弈的Nash均衡点,以及受耦合约束的两种群演化博弈具有不变集的约束,即在初始条件满足的情况下,在演化博弈演化的过程中始终能够保持约束条件的满足。将多智能体编队控制问题转化成为演化博弈问题,从而将集中式的优化问题拆分成若干个子问题,然后分配给每个子智能体进行求解。每个自智能体利用自己信息、局部的模型以及可以获得的邻居信息对子问题进行求解,从而大大降低了计算量和复杂度;另外也弥补了传统的分散式控制由于信息交互能力不足所带来的性能下降问题,使控制性能保持在较高的水平,同时提高了系统的灵活性,可扩展性;本发明采用了无领导者的编队控制算法,所有智能体具有相同的角色和功能,因而能够解决leader-follower编队控制算法中的缺点。

2、本发明利用模型预测控制算法为构建全局优化问题,通过在全局模型预测成本函数中设计一个编队误差函数,来实现编队的目的。通过引引入不变集的性质来保证每个智能体在移动的过程中不会发生碰撞。

3、本发明对于时变的通信网络也同样适用。在提高了控制性能和安全性能的同时,降低了计算的复杂程度,减少了通信负担,解决了现有的部分编队控制算法不能处理具有通讯约束或时变通讯网络的问题。

附图说明

图1为本发明中编队控制问题和演化博弈问题之间的转换图;

图2为本发明中6个智能体的二维实际轨迹图;

图3为本发明中每个智能体的位置坐标—时间曲线图;

图4为本发明中每个智能体对的安全距离—时间曲线;

图5为本发明中每个智能体的控制输入—时间曲线图。

具体实施方式

下面结合附图并举实施例,对本发明进行详细描述。

本发明在多智能体编队中引入了演化博弈算法,演化博弈作为一种数学工具,能够在仅知道部分参与者的部分信息情况下,描述决策者的行为。通过不断迭代和优化,使得参与者的局部行为可以达到一个整体的目标。因此演化博弈适合解决分布式多智能体编队控制问题。本发明提供的一种基于分布式演化博弈的分布式模型预测无领导者编队控制方法,包括以下步骤:

第一部分,构建多智能体系统,包括如下子步骤:

步骤11,系统架构的设计

考虑一个具有

其中,

步骤12,确定每个智能体的通信拓扑和目标。每个多智能体的通讯范围是

(1)控制目标:

(2)避障约束:d

(3)位置约束:

(4)输入约束:

(5)期待状态要求:

步骤13,为每个智能体设计安全距离集。在每个时刻k,获取到i智能体和其所有的邻居j智能体的位置c

其中

其中,δ

步骤14,构建模型预测优化问题。为了实现控制目标,令

其中,

min

s.t.form=0,1,…,H

当优化问题(8)存在可行解时,会求得未来一段时间内的最优控制输入,考虑到实际应用中存在模型失配,受到干扰等原因,并不是将所求解到的最优控制序列逐一全部应用到系统中,而是将最优控制序列中的第一个元素被用于实际系统中。在下一时刻k+1,重新采样系统的当前状态,重新构造优化问题(8)并进行求解,继续重复前述步骤。但是此时构建的优化问题还是集中式的优化问题,在一下步骤中,将通过分布式演化博弈的方法来对上述的优化问题进行分布式求解。

由于避碰约束本质上是非凸的,它可能导致非凸优化问题。为了解决这个计算问题,引入Voronoi图的思想为每个智能体创建安全距离集。保证每个智能体只要在规定的安全距离集中移动时,一定不会发生碰撞。

第二部分,受耦合约束的两种群演化博弈。建设有两个种群p∈(1,2),在每个种群中都具有大量且有限的参与者,且在两个种群中具有相同的策略集S。令s

步骤21,演化博弈中的通讯拓扑图设置。对于两个种群(x,y),为保持一定平衡,需要满足集合Ξ={(x,y)∣Ax+By≤C},其中A=diag{a

进化博弈的优化问题通过寻找纳什平衡点进行求解,并可以描述为:

max

s.t.Ax+By≤C (9b)

x

y

其中,代价函数W(x,y)是严格连续可微的凹函数,(x

种群x与种群y中采用策略i的比例变化进化过程可以由分布式进化动力学描述,其表达式为:

这种动力学也称为平均动力学。此外,修正协议φ

步骤21,通讯协议的设定。对于任意给定的x和y,使用

将(12)代入到(10)和(11),可以得到

这就是具有耦合约束的两个种群的分布式史密斯动力学(DSD2PC),具有这种动力学的进化博弈被称为具有耦合约束的两个种群的分布式进化博弈(DEG2PC)。

将进化动力学表达为紧集的形式,表达式为

其中,

S10、证明受两种群约束的演化博弈具有不变集的性质。若给定(x,y)∈Ξ∩Λ,由

因此,r

由拉普拉斯矩阵的关系式

根据r

S11、根据引理1的

因此对于x

当(x(0),y(0))∈Ξ时,一旦轨迹(x(t),y(t))到达集合Ξ边界,对于i∈S,满足a

在以下四种情况讨论

则始终满足非负性

S12、选取E(x,y):=W(x

因此,当初始值(x(0),y(0))∈Ξ沿着(13)和(14)进化时,DEG2PC趋近于纳什平衡点,并且纳什平衡点是局部渐近稳定的。

第三部分,基于DEG2PC理论的分布式模型预测控制算法:

步骤31,本发明中编队控制问题和演化博弈问题之间的转换图如图1所示,使用演化博弈论的方法,将DEG2PC理论中的种群状态(x

根据(6)中的动力学模型,u

u

v

并将(19)和(20)代入优化问题(8)中。由于问题(8)中是最小化代价函数J(k),问题(9)是最大化凹函数W(x,y),因此对于每种策略的适应度函数可以描述为f

步骤32,对于种群x和y,选择如(12)中的修正协议,使用(15)和(16)的动态演化,种群结果会趋向于纳什平衡点。之后,在时刻k可以得到最优位置轨迹(x

综上,基于分布式进化博弈的分布式模型预测无领队编队控制方法可以描述为:给定输入:期望位置

(1)在时刻k给定样本z

(2)构造编队控制问题(8);选取

(3)对于每个策略f

(4)通过(13)和(14),求解最优位置轨迹(x

(5)将u

第四部分,理论仿真。选择一个具有六个智能体的多智能体系统,对于每个智能体

每个智能体的输入约束

c

c

为了形成一个编队队形,每个智能体的期待位置为:

在MATLAB上运用ICLOCS和PDToolbox求解工具进行仿真实验,结果如附图说明所示,图2为本发明中6个智能体的二维实际轨迹图,图3为本发明中每个智能体的位置坐标—时间曲线图,图4为本发明中每个智能体对的安全距离—时间曲线,图5为本发明中每个智能体的控制输入—时间曲线图。图2中仿真结果表明,在该算法控制下,各个智能体最终能够到达指定的目标点。图3为各个智能体在移动过程中的位置。图4中的各个子图分别展示了智能体之间的相对位置,可以看出智能体之间的相对位置始终大于安全距离0.5,即智能体具有避碰的效果。图4的结果显示了智能体在移动的过程中能够保证输入约束的满足。

综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号