法律状态公告日
法律状态信息
法律状态
2019-11-22
授权
授权
2016-08-03
实质审查的生效 IPC(主分类):G05B13/04 申请日:20151229
实质审查的生效
2016-07-06
公开
公开
技术领域:
本发明属于多无人机协调控制技术领域,是一种基于滚动时域法的多无人机协同打击任务的分配方法。
背景技术:
战机在当今战争中发挥着重要的作用,它己经成为世界性大范围战争中最有力、最合适的武器,研究战机的作战效能不仅有助于提升战机性能、促进战技术发展进步,而且也对加强我国国防事业发展有着重要的意义。虽然单机作战具有一定的优势,但是在战场日益复杂化的今天,单机作战已经远远不能满足作战的要求,多机协同作战能够弥补单机作战能力弱的缺点,在目标探测、目标打击和综合火力方面有着单机作战无法比拟的优势,能够达到以弱胜强的目的。因此,多机协同作战是未来空战的主要作战模式,它能够使得整体的作战效能大幅度提升。然而多无人机在执行任务中,能否成功完成任务的关键问题之一是无人机之间的妥善协调问题。如何通过合理的决策策略使得无人机相互协调完成复杂任务是无人机领域研究的热点问题。目前,有关多无人机协同任务分配的研究已经取得了一些有价值的研究成果。虽然关于多无人机协同任务分配的研究已经取得了一些研究成果,但在已有的文献中,建立的多机协同任务分配模型没有考虑多无人机协同打击的能力问题,也没有考虑目标需要获得被打击的能力值问题,计算航程代价均考虑始发点与目标点之间的航程,而且没有将滚动时域法引入到多无人机协同任务分配中,建立的多无人机作战模型还不是很完善。
发明内容:
本发明针对多无人机任务分配问题,首先建立了无人机的能力函数,然后通过能力函数的雅可比矩阵,给出多无人机协同打击位置的计算方法;进而建立了无人机毁伤代价指标函数、航程代价指标函数和多无人机协同任务分配模型,并利用滚动时域法,将整个机动接敌过程进行时间和空间的离散化,分段求取最佳的机动策略,给出了多无人机协同打击任务的最优决策方法。
基于滚动时域法的多无人机协同打击任务的分配方法,包括以下步骤:
基于滚动时域法的多无人机协同打击任务的分配方法,包括以下步骤:
步骤1:无人机能力函数及协同打击航程的计算;
步骤2:多无人机协同任务分配模型的建立;
步骤3:通过滚动时域控制及其数值解法,将机动决策问题建模为最优控制问题,然后将整个机动接敌过程进行时间和空间的离散化,分段求取最佳的机动策略,给出了多无人机协同打击任务的最优决策方法。
所述步骤1包括以下步骤:
步骤1.1:无人机能力函数的建立,量化无人机对目标的打击能力;
步骤1.2:雅可比矩阵的建立;
步骤1.3:多无人机协同打击位置的计算;
步骤1.4:多无人机协同打击航程的计算。
所述步骤2包括以下步骤:
步骤2.1:建立目标价值收益指标函数;
步骤2.2:建立毁伤代价指标函数;
步骤2.3:建立航程代价指标函数;
步骤2.4:建立多无人机协同打击任务的总体收益模型。
所述步骤3包括以下步骤:
步骤3.1:利用滚动时域控制方法获得获取最优开环控制函数;
步骤3.2:直接多重打靶的参数化方法将上述最优控制问题转化为非线性规划(NLP)问题进行求解。
本发明的特点及有益效果:本发明将能力函数与多无人协同打击任务分配模型相结合,提出了基于滚动时域法的多无人机协同打击任务的分配方法。滚动时域控制方法只要求对沿系统当前轨迹中遇到的状态求解最优控制,避免了Hamilton-JacobiBellman(HJB)方法的维数灾问题;可以实现多无人机协同打击任务的最优分配策略,本发明能够获得更大的目标收益值和毁伤效能,且提高了多无人机协同打击能力。
附图说明:
图1是本发明的无人机能力函数曲线;
图2是实施例中目标1、2获得被打击的能力值示意图;
图3是本发明实施例的无人机攻防对抗示意图。
具体实施方式:
步骤1:无人机能力函数及协同打击航程的计算
步骤1.1无人机能力函数的建立
能力函数是体现无人机对目标的打击能力,主要是根据任务的要求和形式来建立。能力函数与无人机与目标之间的距离和方位等因素有关。多无人机的能力函数是单无人机的能力函数之和。为了简化分析,假设能力函数仅考虑与目标点的距离,当无人机与目标点的距离满足要求时,无人机就能实现最大的能力值。
无人机的位置信息存储在n×3矩阵中,n表示无人机的数量。目标点信息存储在m×3矩阵中,m表示目标数量。无人机与目标的初始三维位置数值信息分别用下列矩阵表示:
无人机i与目标j的距离dij描述为
设无人机的作战半径为Di,假定能力函数的最大值为1,目标j获得无人机的能力函数Bi为:
假设作战侦察半径为4.5km,通过图1所示能力函数曲线可以看出:当无人机与目标的距离大于4.5km时,能力值随着距离的增加而下降;当无人机与目标的距离小于4.5km时,能力值随着距离的增加而上升;只有当无人机与目标的距离等于4.5km时,无人机释放最大的能力。
步骤1.2:雅可比矩阵的建立
对于我方无人机,为了更有效地完成任务,需要分析无人机位置变化对目标所需要的武器能力的影响,建立能力函数的雅可比矩阵,可描述无人机的位置变化对于目标所释放的能力的影响:
目标j获得的能力函数Ci相对于无人机i的位置偏导数为
步骤1.3:多无人机协同打击位置计算
能力函数由无人机的位置决定,能力函数的变化与位置的关系为
假设目标j需要获得的理想能力为
式中,
J+=JT(JJT)-1(10)
式中:J+表示伪逆;JT表示雅可比矩阵的转置。
若多无人机协同打击不能达到理想的目标的能力值时,需要更新无人机的位置。根据式(1.9)得到的无人机位置的理想变化值
步骤1.4:多无人机协同打击航程的计算
通过将无人机更新后的位置坐标带入式(2)及(3),得到新的无人机能力值,按照(1~11)更新无人机位置,直到达到理想能力值
步骤2:多无人机协同任务分配模型的建立
在进行多无人机任务分配时,主要需要考虑以下两个方面的因素:1)对敌方目标的整体打击和毁伤效果,2)我方在攻击敌方目标过程中付出的代价,其中我方代价又可分为以下两个方面,一是在攻击敌方目标过程中被敌方防空火力系统攻击时所遭受的毁伤代价,另一个是攻击目标时的燃油代价,即航程代价。假设我方由n架无人机组成,敌方由m个分散的地面目标以及Mn个防空火力组成。
步骤2.1:建立目标价值收益指标函数
目标价值收益是指我方无人机攻击敌方目标对敌方目标造成的损耗,在作战过程中,攻击敌方目标所获得的价值收益是我方需要考虑的一个重要因素,多无人机编队在攻击敌方目标时所产生的价值收益总量越高越好。若无人机对目标的杀伤概率矩阵为P=[P1jP2j…Pmj],则第i架无人机对目标的杀伤概率为:
ηi是在tk<t<tk+1期间敌方防空火力j被无人机摧毁的概率,考虑到防空火力和目标之间的距离越近,防空火力被无人机摧毁的概率越大,则:
ηi为第i架无人机对目标的单发命中概率,且无人机对目标打击是相互独立的事件,ni为第i架无人机携带的武器数。这里dij为无人机i与目标j的距离,um为我方无人机有效射程,
若q架无人机合作同时攻击第j个目标,则我方q架无人机攻击敌方第j地面目标的收益指标函数
步骤2.2:建立毁伤代价指标函数
在我方无人机对敌方目标进行攻击过程中,我方无人机损耗是指敌方目标防守火力反击对我方无人机造成的损失,我方每个无人机损耗为我方无人机的损伤程度与该无人机价值的乘积,假设各目标对第i架无人机造成毁伤为相互独立的事件,P’ij(q+1)为在tq<t<tq+1期间第i架无人机在攻击第j个目标过程中遭受的毁伤概率,可表示为:
Mn是敌方防空火力的数量,δn(q+1)是在tq<t<tq+1期间无人机被敌方防空火力j摧毁的概率,考虑到防空火力和目标之间的距离越近,无人机在攻击该目标时被防空火力摧毁的概率越大,则δn(q+1)表示为:
这里dij为无人机i与目标j的距离,ej为敌方防空火力的有效射程。θj∈[0,1]是当敌方第j个防空火力与无人机接触时摧毁无人机的效能。则无人机在攻击各个目标时受到来自敌方防空火力的攻击,则在整个打击任务过程中,该无人机的总的毁伤代价损失为
这里
步骤2.3:建立航程代价指标函数
无人机的执行任务航程代价与无人机执行任务期间飞行的路径有正相关的关系,则航程代价可用下式表示:
其中,Di为无人机i实际飞行的航程,即无人机i初始位置与打击位置之间的距离,Dmax为所有无人机i实际飞行的最大航程。
步骤2.4:建立多无人机协同打击任务的总体收益模型
在目标分配时,目的是在保证多无人机编队完成预定任务的情况下,能通过攻击敌方目标,获得最大的价值收益,同时使我方付出的代价达到最小,另外作战过程中由于考虑的各指标的重要性不同,即权重不同,由此,分配模型的总体目标函数可表示为:
s.t.
w1+w2+w3=1(25)
w1、w2和w3分别代表攻击目标所获的价值收益指标,攻击目标过程中的毁伤代价权重,航程代价指标权重。公式(23)要求每架无人机每次最多分配给一个目标,公式(24)要求最多h(h根据实际打击任务的要求而定,且h≤n)架无人机协同打击一个目标。
步骤3:通过滚动时域控制及其数值解法,将机动决策问题建模为最优控制问题,然后将整个机动接敌过程进行时间和空间的离散化,分段求取最佳的机动策略,给出了多无人机协同打击任务的最优决策方法。
步骤3.1:滚动时域控制方法
滚动时域控制中,载机的控制量u的决策在离散时刻t=k△t进行,△t是决策时间间隔。tk时刻的状态记为x(tk),在时域t∈[tk,tk+T]上,通过求解如下模型获取最优开环控制
式中:积分部分等于规划时域T(T>△t),上的指标函数J的累积值,V(·)为值函数,用以逼近从x(tk+T)到最终状态的最优代价。
将当前状态测量值作为初始条件,并视为欧拉-拉格朗日型轨迹优化问题进行求解,在线计算出最优控制解u*,在时域T内执行控制u*,直到系统获得新的状态测量值,并将其作为新的初始条件。重复上述过程,计算出下一有限时域的最优控制解,不断反复进行直到满足要求,便得到一组状态反馈控制律。滚动时域控制方法只要求对沿系统当前轨迹中遇到的状态求解最优控制,避免了Hamilton-JacobiBellman(HJB)方法的维数灾问题。
步骤3.2:RHC的数值解法
最优控制问题的一般解法是,将最优控制问题转化为参数最优化问题,再采用非线性规划求解。本文采用一种直接多重打靶的参数化方法将上述最优控制问题转化为非线性规划(NLP)问题,以便于求解。首先,离散化时间
给定控制向量ui和初始状态
采用四架无人机执行两个地面目标任务具体的实施效果:
假设我方无人机所携带武器数为[1111],敌方防空火力的数量均为1,敌我双方有效射程分别为12km和10km,无人机对敌方的摧毁效能矩阵为[0.950.940.960.93],无人机对敌方的摧毁效能矩阵为[0.950.96]。
四架无人机攻击两个目标,有六种方案。分别为:
表1分配方案
其中,方案1的分配矩阵为[1234],表示第1架和第2架无人机攻击目标1,第3架和第4架无人机攻击目标2。以下方案类似。
下面分别采用两种方法,给出多无人机的分配方案。
方法1:通过式(3)、(4)计算出多无人机的能力函数,雅可比矩阵,然后分别计算目标价值收益,毁伤代价,航程代价,最后通过式(28)分别仿真计算各个方案的收益值。最后得到各个方案收益值分别为
表2方法1的分配方案收益值
通过表2可以看出,方案4的收益值最大,所以按照第4种方案进行分配,[2314]第2架和第3架无人机攻击目标1,第1架和第4架无人机攻击目标2。按照第4种方案进行分配,当仿真到最后,越接近理想能力值2时,无人机的控制量越小,无人机位置变化越小,仿真时间越长,而实际目标打击能力值为1.5时,就可以达到打击效果。因此,采用1.5作为终止仿真条件。目标1获得被打击的能力值如图2,目标2获得被打击的能力值如图2。
从图2可以看出,在每隔10计算1次目标1获得的能力值,在经过2次之后,即20s时,目标1可获得理想被打击的能力值为1.5,在经过3次之后,即30s时,即可达到理想被打击的能力值1.5。
按照方案4的无人机攻防对抗示意图如图3所示。
方法2:按照以往多无人机任务分配方法[13],没有考虑多无人机协同打击能力函数,也没有考虑目标需要获得的能力值,因而不用考虑滚动时域法,按模型(21),其中di为第i架无人机到第j个目标的初始距离,得到各个方案收益为
表3方法2的分配方案收益值
由于第5种方案收益值最大,收益值为0.1038,则按照第5种方案进行分配,即[2413],第2架和第4架无人机攻击目标1,第1架和第3架无人机攻击目标2。
从表2和表3可以看出,两种方法的不同之处主要包含以下几方面:一是方法2的决策结果与方法1的决策结果完全不同,即方法1的决策结果是方案4,而方法2的决策结果是方案5;二是;方法1的收益比方法2的收益大,即方法1的最大收益为0.7381,而方法2的最大收益为0.1038;三是方法2没有考虑多无人机的协同打击能力和目标需要获得被打击的能力值,且没有考虑攻击过程中的价值收益。因此,可以得出如下结论:本方法能够获得更大的目标收益值和毁伤效能,且提高了多无人机协同打击能力。
机译: 基于学习遗传算法的多任务多资源滚动分配方法
机译: 机队管理系统中基于任务算子水平的自动任务分配方法
机译: 任务分配程序,任务执行程序,任务分配设备,任务执行设备和任务分配方法