技术领域
本发明涉及多智能体协同控制领域,具体为一种多智能体系统控制方法。
背景技术
在过去二十年中,由于多智能体系统分布式协同控制的巨大潜在价值,科研界对其给予了高度关注,这其中包括分布式一致性控制,包围控制,分布式优化,队形控制等。
在多智能体协同控制方法中,最早的协同控制算法大都是渐进稳定的,也就是当时间趋于无穷时,系统才会收敛到平衡点。这种算法在理论上可以实现,但在工程领域却有着非常大的局限性,因为现实中往往要求控制系统在有限的时间内完成指定任务。为了使系统可以更快速地收敛,有学者提出了有限时间稳定性算法,即系统可以在有限的时间内收敛到平衡点。该方法虽然有效地提高了系统的收敛速度,但系统的稳定时间上界却无法确定。因为系统的稳定时间会受到系统初始位置的影响,往往系统的初始状态越远离平衡点,其收敛到平衡点的时间也会越长。这在某些要求严格知道系统稳定时间上界的情况下,或者要求系统必须在任意初始位置都可以在给定时间收敛到平衡位置的情况下,有限时间控制方法无法满足任务需求,于是有学者提出了固定时间稳定控制方法。
固定时间稳定控制方法要求无论系统在任何初始位置,都可以在任意给定的时间内稳定,即系统到达平衡位置并保持。相比于有限时间稳定控制方法,固定时间稳定控制方法不受系统初始状态的限制,也因此具有更广阔的应用空间,具有很高的研究价值。在多智能体协同控制领域中,固定时间稳定控制方法也占据着重要地位。通过将固定时间稳定控制方法与多智能体协同控制相结合,可以实现多智能体的固定时间协同控制,常见的有多智能体固定时间一致性、固定时间领跟一致性、固定时间编队和固定时间分布式平均跟踪等。现有的多智能体系统固定时间协同控制大多会需要一个很大的初始控制输入,这在某些性能一般的系统中可能会造成系统输入饱和。
发明内容
为了克服现有技术的不足,本发明提供一种二阶多智能体系统固定时间领跟一致性控制方法,利用Time Base Generator设计二阶多智能体系统固定时间领跟一致性算法来避免过大的控制输入需求,从而更有效地解决二阶多智能体固定时间领跟一致性问题。此外,基于Time Base Generator的固定时间方法在调节稳定时间上界时仅需调整一个算法参数,避免了调节过多参数所导致的其它不确定性。通过该算法,在任意初始状态下,二阶多智能体系统的多个跟随者都能够在给定时间内跟踪上领导者的状态。
本发明解决其技术问题所采用的技术方案的步骤如下:
包括以两个方面:分别是在无向通信条件下基于Time Base Generator的二阶多智能体系统固定时间领跟一致性计算和在有向通信条件下基于Time Base Generator的二阶多智能体系统固定时间领跟一致性计算;
一)无向通信条件下基于Time Base Generator的二阶多智能体系统固定时间领跟一致性计算
一个含有n+1个智能体的二阶积分器型多智能体系统,其中1个为领导者,剩余n个为跟随者,n个跟随者之间通信拓扑图为无向连通图,领导者仅与部分跟随者保持通信,利用积分器对多智能体系统进行数学建模方式;领导者系统模型如下:
其中,x
跟随者系统模型如下:
其中,x
步骤1.1:为除领导者外每一个智能体构建分布式固定时间状态观测器;
为每一个跟随者设计基于Time Base Generator的固定时间分布式状态观测器观测自身与领导者的相对状态信息;
原有的Time Base Generator函数ξ(t)如下:
其中,t
构建的Time Base Generator函数如下:
其中t
令函数k(t)如下:
其中,κ
令
令矩阵Q=L+B,L为跟随者对应的拉普拉斯矩阵,B=diag{a
观测器q
步骤1.2:为除领导者外每一个智能体构建固定时间控制器;
利用滑模控制方法设计控制器;利用Time Base Generator设计出固定时间滑模面,当系统状态位于滑模面上时,系统将会在固定时间内滑到平衡位置,再根据滑模面设计控制输入,使得系统在固定时间内从初始位置移动到滑模面上;
构造固定时间滑模面如下:
构造固定时间控制器如下:
其中令t
步骤1.3:将控制器(8)和观测器(6)代入公式(2);
多智能体系统将在固定时间内实现:
其中,T=t
二)有向通信条件下基于Time Base Generator的二阶多智能体系统固定时间领跟一致性计算;
一个含有n+1个智能体的二阶积分器型多智能体系统,其中1个为领导者,剩余n个为跟随者,n个跟随者之间通信拓扑图存在一个有向生成树,领导者为根节点,智能体系统模型如公式(1)和公式(2)所示;
步骤2.1:为除领导者外每一个智能体构建分布式固定时间状态观测器:
令H=L+B,其中L∈R
步骤2.2:为除领导者外每一个智能体构建固定时间控制器;
有向通信条件下的二阶多智能体领跟一致性控制器设计与无向通信条件下相同,控制器如公式(8)所示;
步骤2.3:将控制器(8)和观测器(10)代入多智能体系统的公式(2),多智能体系统将在固定时间内实现公式(9)所示的二阶多智能体系统固定时间领跟一致性。
本发明的有益效果在于利用Time Base Generator分别解决了无向通信条件下和有向通信条件下的二阶多智能体系统固定时间领跟一致性问题。基于Time BaseGenerator的固定时间领跟一致性方法所需要的初始控制输入相对更小,更不容易造成系统输入饱和,因此也极大的提高了算法的适用范围。本发明在调节稳定时间上界时,仅需要调节稳定时间上界这一个参数即可,相比需要同时调节多个参数的算法,本发明更简单适用且降低了因调节参数而带来的系统不稳定性。
附图说明
图1是多智能体无向通信网络拓扑图。
图2是无向通信条件下速度观测器状态曲线图。
图3是无向通信条件下位置观测器状态曲线图。
图4是无向通信条件下多智能体速度状态曲线图。
图5是无向通信条件下多智能体位置状态曲线图。
图6是多智能体有向通信网络拓扑图。
图7是有向通信条件下速度观测器状态曲线图。
图8是有向通信条件下位置观测器状态曲线图。
图9是有向通信条件下多智能体速度状态曲线图。
图10是有向通信条件下多智能体位置状态曲线图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
为了更好的阐述本发明,下面结合附图和实施例分别对无向通信和有向通信条件下的固定时间领跟一致性算法进行说明。
一)无向通信条件下基于Time Base Generator的二阶多智能体系统固定时间领跟一致性计算
一个含有n+1个智能体的二阶积分器型多智能体系统,其中1个为领导者,剩余n个为跟随者,n个跟随者之间通信拓扑图为无向连通图,领导者仅与部分跟随者保持通信,利用积分器对多智能体系统进行数学建模方式;领导者系统模型如下:
其中,x
跟随者系统模型如下:
其中,x
步骤1.1:为除领导者外每一个智能体构建分布式固定时间状态观测器;
因为系统通信方式为分布式,仅有部分跟随者直接获取自身与领导者的相对状态信息,先为每一个跟随者设计基于Time Base Generator的固定时间分布式状态观测器来观测自身与领导者的相对状态信息;
原有的Time Base Generator函数ξ(t)如下:
其中,t
因为多智能体系统为二阶系统,观测器由双积分器构成,原有的Time BaseGenerator函数无法满足任务需求,重新构建的Time Base Generator函数如下:
其中t
令函数k(t)如下:
其中,κ
令
令矩阵Q=L+B,L为跟随者对应的拉普拉斯矩阵,B=diag{a
观测器q
步骤1.2:为除领导者外每一个智能体构建固定时间控制器;
利用滑模控制方法设计控制器;利用Time Base Generator设计出固定时间滑模面,当系统状态位于滑模面上时,系统将会在固定时间内滑到平衡位置,再根据滑模面设计控制输入,使得系统在固定时间内从初始位置移动到滑模面上;
构造固定时间滑模面如下:
构造固定时间控制器如下:
其中令t
步骤1.3:将控制器(8)和观测器(6)代入公式(2);
多智能体系统将在固定时间内实现:
其中,T=t
二)有向通信条件下基于Time Base Generator的二阶多智能体系统固定时间领跟一致性计算;
有向通信条件下,智能体之间的通信不再是双向的,即两个智能体之间存在指定方向的信息流,两个智能体之间仅有一个可以获取对方状态信息。有向通信的多智能体系统通信拓扑图所对应的拉普拉斯矩阵为非对称矩阵,控制算法的设计难度比无向通信要高,算法也比无向通信更复杂。但有向通信的多智能体系统占用资源更少,对物理设备的要求更低,因此将无向通信算法拓展到有向通信很具有现实意义。
一个含有n+1个智能体的二阶积分器型多智能体系统,其中1个为领导者,剩余n个为跟随者,n个跟随者之间通信拓扑图存在一个有向生成树,领导者为根节点,智能体系统模型如公式(1)和公式(2)所示。
步骤2.1:为除领导者外每一个智能体构建分布式固定时间状态观测器:
令H=L+B,其中L∈R
步骤2.2:为除领导者外每一个智能体构建固定时间控制器;
因为已经通过观测器获取了自身与领导者的相对状态信息,控制器的设计将不再依赖于邻居信息,因此有向通信条件下的二阶多智能体领跟一致性控制器设计与无向通信条件下相同,控制器如公式(8)所示;
步骤2.3:将控制器(8)和观测器(10)代入多智能体系统的公式(2),多智能体系统将在固定时间内实现公式(9)所示的二阶多智能体系统固定时间领跟一致性。
实施例如下:
1)无向通信条件下基于Time Base Generator的二阶多智能体系统固定时间领跟一致性算法
假设一个含有6个智能体的二阶积分器型多智能体系统,其中1个为领导者,剩余5个为跟随者,系统模型分别如公式(1)和公式(2)所示,观测器和控制器分别如公式(6)和公式(8)所示,系统网络通信拓扑结构如图1所示,稳定时间上界设定为t=12s,其中t
2)有向通信条件下基于Time Base Generator的二阶多智能体系统固定时间领跟一致性算法
假设一个含有5个智能体的二阶积分器型多智能体系统,其中1个为领导者,剩余4个为跟随者,系统模型分别如公式(1)和公式(2)所示,观测器和控制器分别如公式(10)和公式(8)所示,系统网络通信拓扑结构如图6所示,稳定时间上界设定为t=12s,其中t
可以理解的是,对本领域普通技术人员来说,可以根据本发明的技术方案及其发明构思加以等同替换或改变,而所有这些改变或替换都应属于本发明所附的权利要求的保护范围。
机译: 智能体的空间分布控制方法,智能体的空间分布控制器,视听系统和顾客指导系统
机译: 衣物处理设备是一种衣物处理设备的控制方法,该方法通过人工智能学习用户的课程和选项模式并推荐定制的课程和选项,以及包括该在线处理系统的在线系统
机译: 摄影控制方法和系统以及交互式智能面板一体机