首页> 中国专利> 面向多对多智能体协同作战场景的火力分配方法及系统

面向多对多智能体协同作战场景的火力分配方法及系统

摘要

本发明公开了面向多对多智能体协同作战场景的火力分配方法及系统,所述方法包括:确定红蓝对抗问题想定,所述红蓝对抗问题想定包括红蓝对抗单元的种类、数量、射击间隔及对抗问题、红蓝双方的目标任务和胜负判断准则;基于语义的想定建模,将所述红蓝对抗问题想定进行结构化抽象,并将博弈对抗问题的图像信息转化为语义信息;基于语义态势认知模块计算火力分配方案,并将所有我方单位指定打击对象;构建语义体系,基于向量化火力打击结果生成火力打击对象决策语义,并执行当前决策指令。本发明尽可能地将火力均匀分配到各个敌方上,使得每一个火力都最大化地得到利用。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-08-30

    实质审查的生效 IPC(主分类):G06Q10/04 专利申请号:2022106655904 申请日:20220614

    实质审查的生效

说明书

技术领域

本发明涉及人工智能中的博弈决策技术领域,尤其涉及一种面向多对多智能体协同作战场景的火力分配方法、系统、终端及计算机可读存储介质。

背景技术

随着卫星遥感、雷达、技侦等侦测手段的发展,出现了包含图像、文本等多种形式的态势描述数据,其中图像数据是一种常见的态势信息传递及决策指挥的处理输入,但图像传输具有高带宽、高通信要求,导致指挥者不能做出较优的态势认知及指挥决策,因此语义态势的处理及认知将会成为未来的研究趋势。以语义态势为背景的多对多的智能体协同作战中,会出现多个已方智能体与多个敌方智能体可以相互攻击,需要在最大程度上选择合适的火力分配方案,使武器系统对敌方的多批目标尽可能地分配给它们射击最有利的火力单元,以达到最优的整体抗击效果,发挥最大的作战效能和防御效能。

在火力分配问题上,每一个智能体都有至少一个可攻击对象,即每一个智能体都可能有多种攻击选择。火力分配的目的,就是对每一个智能体找到一种攻击选择,使得在协同作战的情况下,对敌方造成最大的损伤。当己方和敌方智能体的数量较少时,可以使用穷举法,穷举各种可能的火力分配策略,然后根据火力分配策略可以计算出在一定的攻击命中率下对敌方的期望损伤,然后找到最优的火力分配算法。当智能体的数量较多时,则需要寻找一个更优的算法进行求解。火力分配问题实质上是一种整数型非线性组合优化决策问题,在计算机的复杂性理论上,属于NP难问题,即需要超多项式时间才能求解的问题。

在作战环境中,需要快速地对火力分配问题作出决策。穷举法在最坏情况下复杂度是指数时间级别,耗时可能会极端漫长,计算代价过大,而模拟退火法、禁忌搜索算法、遗传算法和群智能算法等算法的实时性和动态性较差,无法应用于复杂多变的作战环境。另外,任务分配过程中不确定性事件是不可避免的,追求全局最优的方法势必很难满足任务分配实时性的要求。因此,次优、快速的任务分配方法在解决任务规划问题时的实时性优势会更加明显。

因此,现有技术还有待于改进和发展。

发明内容

本发明的主要目的在于提供一种面向多对多智能体协同作战场景的火力分配方法、系统、终端及计算机可读存储介质,旨在解决现有技术中活力分配方法无法满足任务分配实时性要求的问题。

为实现上述目的,本发明提供一种面向多对多智能体协同作战场景的火力分配方法,所述面向多对多智能体协同作战场景的火力分配方法包括如下步骤:

确定红蓝对抗问题想定,所述红蓝对抗问题想定包括红蓝对抗单元的种类、数量、射击间隔及对抗问题、红蓝双方的目标任务和胜负判断准则;

基于语义的想定建模,将所述红蓝对抗问题想定进行结构化抽象,并将博弈对抗问题的图像信息转化为语义信息;

基于语义态势认知模块计算火力分配方案,并将所有我方单位指定打击对象;

构建语义体系,基于向量化火力打击结果生成火力打击对象决策语义,并执行当前决策指令。

所述的面向多对多智能体协同作战场景的火力分配方法,其中,所述确定红蓝对抗问题想定,所述红蓝对抗问题想定包括红蓝对抗单元的种类、数量、射击间隔及对抗问题、红蓝双方的目标任务和胜负判断准则,之后还包括:

搭建红蓝对抗场景,提供各自阵营视角的红蓝双方态势语义信息。

所述的面向多对多智能体协同作战场景的火力分配方法,其中,所述基于语义的想定建模,将所述红蓝对抗问题想定进行结构化抽象,并将博弈对抗问题的图像信息转化为语义信息,具体包括:

构建语义态势认知模块,针对红蓝双方态势语义信息进行语义态势的解析和语义认知得到向量化的敌我位置、敌方对我方的威胁度的态势信息;

初始化交战字典A,记录每一个我方单位可以攻击到的敌方单位;其中,关键字:己方单位army,值:可攻击的敌方列表;初始值为空,表示目前每一个我方单位都没有可攻击的敌方单位;

A[army]={};

其中,army表示我方单元的集合;A[army]表示用于存储我方单位可攻击到的敌人的集合信息;

初始化瞄准字典B,记录每一个敌方单位已经被瞄准攻击的火力的命中率列表;其中,关键字:敌方单位enemy,值:已经被瞄准攻击的单位列表的命中概率;在算法初期,所有值都为空,表示目前敌方单位都没有被我方单位瞄准攻击,此时尚未分配火力攻击的目标;

B[enemy]=[];

其中,enemy表示敌方单元的集合;B[enemy]表示用于存储已经分配的敌方单位受到我方哪些单位攻击的火力命中概率集合信息;

基于所述语义态势认知模块解析后的向量化态势信息计算交战字典A,保存每个己方单位army可攻击到的敌方列表:遍历自己的所有单位,计算每个单位可攻击的敌方单位,并加入到A[army]中;此时,每个A[army]中的元素是army单位能够攻击的enemy单位的集合。

所述的面向多对多智能体协同作战场景的火力分配方法,其中,所述基于语义态势认知模块计算火力分配方案,并将所有我方单位指定打击对象,具体包括:

循环遍历army,找到只可攻击一个敌方单位的己方进行先分配;若存在某个army

取出敌方单位:enemy

更新攻击关系:P[army

army的火力命中概率加入到B[enemy]:B[enemy

其中,P[army]用于存储我方对敌方的攻击关系,每个位置仅仅保存一个元素;p表示环境提前设定的火力命中概率,是一个0~1之间的概率值,代表了单位一次开火可能击毙对方的概率;

循环遍历enemy,找到当前被已分配的火力击毙概率最小的敌方,每一次只分配一个火力;根据瞄准字典B计算被摧毁概率,从小到大排序,寻找一个能攻击此敌方的己方单位,分配并更新;

若当前enemy

再次进入遍历,直到所有我方单位都被指定了打击对象为止。

所述的面向多对多智能体协同作战场景的火力分配方法,其中,通过语义矩阵对所述红蓝对抗问题想定进行表达,以将博弈对抗问题的图像信息转化为语义信息。

所述的面向多对多智能体协同作战场景的火力分配方法,其中,所述语义矩阵包括:攻击矩阵、火力命中概率集合矩阵和对敌攻击关系矩阵。

所述的面向多对多智能体协同作战场景的火力分配方法,其中,基于向量化火力打击结果生成火力打击对象决策语义的目标为寻找火力分配策略使得敌方的期望损伤最大。

此外,为实现上述目的,本发明还提供一种面向多对多智能体协同作战场景的火力分配系统,其中,所述面向多对多智能体协同作战场景的火力分配系统包括:

想定确认模块,用于确定红蓝对抗问题想定,所述红蓝对抗问题想定包括红蓝对抗单元的种类、数量、射击间隔及对抗问题、红蓝双方的目标任务和胜负判断准则;

建模转化模块,用于基于语义的想定建模,将所述红蓝对抗问题想定进行结构化抽象,并将博弈对抗问题的图像信息转化为语义信息;

火力计算模块,用于基于语义态势认知模块计算火力分配方案,并将所有我方单位指定打击对象;

生成执行模块,用于构建语义体系,基于向量化火力打击结果生成火力打击对象决策语义,并执行当前决策指令。

此外,为实现上述目的,本发明还提供一种终端,其中,所述终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的面向多对多智能体协同作战场景的火力分配程序,所述面向多对多智能体协同作战场景的火力分配程序被所述处理器执行时实现如上所述的面向多对多智能体协同作战场景的火力分配方法的步骤。

此外,为实现上述目的,本发明还提供一种计算机可读存储介质,其中,所述计算机可读存储介质存储有面向多对多智能体协同作战场景的火力分配程序,所述面向多对多智能体协同作战场景的火力分配程序被处理器执行时实现如上所述的面向多对多智能体协同作战场景的火力分配方法的步骤。

本发明中,确定红蓝对抗问题想定,所述红蓝对抗问题想定包括红蓝对抗单元的种类、数量、射击间隔及对抗问题、红蓝双方的目标任务和胜负判断准则;基于语义的想定建模,将所述红蓝对抗问题想定进行结构化抽象,并将博弈对抗问题的图像信息转化为语义信息;基于语义态势认知模块计算火力分配方案,并将所有我方单位指定打击对象;构建语义体系,基于向量化火力打击结果生成火力打击对象决策语义,并执行当前决策指令。本发明在多对多的智能体协同作战中针对智能体火力分配的方法,形成了有效的博弈策略求解方法,为智能体有效掌握战场态势、合理分配侦测资源、为作战单元提供信息支持,尽可能地将火力均匀分配到各个敌方上,使得每一个火力都最大化地得到利用。

附图说明

图1是本发明面向多对多智能体协同作战场景的火力分配方法的较佳实施例的流程图;

图2是本发明面向多对多智能体协同作战场景的火力分配方法的较佳实施例中火力分配问题求解过程的示意图;

图3是本发明面向多对多智能体协同作战场景的火力分配系统的较佳实施例的原理示意图;

图4为本发明终端的较佳实施例的运行环境示意图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明的目的在于提供一种火力分配问题的求解方法,主要针对多智能体实时对战过程中如何正确地对每一个智能体选择攻击对象,从而得到一个好的协同攻击策略。

其中,火力分配问题可以进行如下描述:假设我方单位的单位数为M,敌方单位数量为N,我方单位i在一个时刻可利用的火力数量为1(若我方单位I在同一时刻可使用多个火力,则单位i可以抽象成多个单位,每个单位携带1个火力),第i个我方单位的单发命中概率为P

矩阵中,x

目标函数:

约束条件:

x

此多单位协同火力分配的数学模型是一个0-1规划问题。

本发明不对原始问题求得全局最优解,而是基于贪心算法的思想,建立了一个以最大化期望损伤为目标的多单位协同火力分配算法,求解得到次优解。

本发明较佳实施例所述的面向多对多智能体协同作战场景的火力分配方法,如图1所示,所述面向多对多智能体协同作战场景的火力分配方法包括以下步骤:

步骤S1、确定红蓝对抗问题想定,所述红蓝对抗问题想定包括红蓝对抗单元的种类、数量、射击间隔及对抗问题、红蓝双方的目标任务和胜负判断准则。

具体地,先确定红蓝对抗问题想定,包含红蓝对抗单元的种类、数量、射击间隔及对抗问题、红蓝双方的目标任务和胜负判断准则,并搭建红蓝对抗场景,提供各自阵营视角的红蓝双方态势语义信息。

步骤S2、基于语义的想定建模,将所述红蓝对抗问题想定进行结构化抽象,并将博弈对抗问题的图像信息转化为语义信息。

具体地,基于语义的想定建模,对红蓝双方对抗的环境进行抽象,忽略掉通过图像形式表达的具体地理位置信息,通过语义矩阵(例如可以是攻击矩阵、火力命中概率集合矩阵、对敌攻击关系矩阵)对想定进行表达,从而实现将博弈对抗问题的图像信息转化为语义信息。相较于传统的图像输入模式,该方法可以极大减小系统输入输出的数据规模,提升运行效率。

本发明主要用到的数据结构如下:

army:我方单元的集合;

enemy:敌方单元的集合;

A[army]:用于存储我方单位可以攻击到的敌人的集合信息;

B[enemy]:用于存储已经分配的敌方单位受到我方哪些单位攻击的火力命中概率集合信息;

P[army]:用于存储我方对敌方的攻击关系,每个位置仅仅保存一个元素,也就是算法的最终计算结果;

p:环境提前设定的火力命中概率,是一个0~1之间的概率值,代表了单位一次开火可能击毙对方的概率。

所述步骤S2具体包括如下步骤:

步骤201:构建语义态势认知模块,针对红蓝双方态势语义信息进行语义态势的解析和语义认知得到向量化的敌我位置、敌方对我方的威胁度的态势信息,支持上述数据结构的初始化及计算。

步骤202:初始化交战字典A,记录每一个我方单位可以攻击到的敌方单位;其中,关键字:己方单位army,值:可攻击的敌方列表;初始值为空,表示目前每一个我方单位都没有可攻击的敌方单位,后续将计算进行填充;

A[army]={}; (2-1)

其中,army表示我方单元的集合;A[army]表示用于存储我方单位可攻击到的敌人的集合信息。

步骤203:初始化瞄准字典B,记录每一个敌方单位已经被瞄准攻击的火力的命中率列表;其中,关键字:敌方单位enemy,值:已经被瞄准攻击的单位列表的命中概率;在算法初期,所有值都为空,表示目前敌方单位都没有被我方单位瞄准攻击,因为此时尚未分配火力攻击的目标;

B[enemy]=[]; (2-2)

其中,enemy表示敌方单元的集合;B[enemy]表示用于存储已经分配的敌方单位受到我方哪些单位攻击的火力命中概率集合信息。

步骤204:基于步骤201的所述语义态势认知模块解析后的向量化态势信息计算交战字典A,保存每个己方单位army可攻击到的敌方列表:遍历自己的所有单位,计算每个单位可攻击的敌方单位,并加入到A[army]中;此时,每个A[army]中的元素是army单位能够攻击的enemy单位的集合。

例如,army

A[army

步骤S3、基于语义态势认知模块计算火力分配方案,并将所有我方单位指定打击对象。

具体地,所述步骤S3具体包括如下步骤:

步骤301:循环遍历army,找到只可攻击一个敌方单位的己方,先分配,即如果存在某个army

取出敌方单位:

enemy

更新攻击关系:

P[army

army的火力命中概率加入到B[enemy];

即:B[enemy

其中,P[army]用于存储我方对敌方的攻击关系,每个位置仅仅保存一个元素;p表示环境提前设定的火力命中概率,是一个0~1之间的概率值,代表了单位一次开火可能击毙对方的概率。

步骤302:循环遍历enemy,找到当前被已分配的火力击毙概率最小的敌方,每一次只分配一个火力。

根据瞄准字典B计算被摧毁概率,从小到大排序,然后寻找一个能攻击此敌方的己方单位,分配并更新。假设当前enemy

步骤303:再次进入遍历,直到所有我方单位都被指定了打击对象为止。

步骤S4、构建语义体系,基于向量化火力打击结果生成火力打击对象决策语义,并执行当前决策指令。

其中,基于向量化火力打击结果生成火力打击对象决策语义的目标为寻找火力分配策略使得敌方的期望损伤最大。

本发明算法的伪代码如下:

进一步地,为了说明本发明的技术方案,举例如图2所示,图2中黑色圆圈表示蓝方,白色圆圈表示红方:

步骤1:假设红蓝对抗问题为陆军枪战,己方为蓝方,敌方为红方,红蓝双方各有5个小兵,每一个小兵的射击命中概率都为0.5;对每一个蓝方小兵,其可攻击对象如图2所示。

步骤2:初始化数据结构的值;

army:{1,2,3,4,5};

enemy:{1,2,3,4,5};

A:{1:[2],2:[2,4],3:[1,3],4:[3,4,5],5:[4,5]};

B:{1:[],2:[],3:[],4:[],5:[]};

P:{1:[],2:[],3:[],4:[],5:[]};

p:0.5;

步骤3:计算火力分配的方案;

步骤3.1:蓝方小兵1只有1个攻击对象,该对象为红方小兵2,故该小兵的策略可确定;

P[1]=A[1]=[2];

B[2]=[0.5];

A[1]=[];

数据结构A、B、P的取值更新为如下:

A:{1:[],2:[2,4],3:[1,3],4:[3,4,5],5:[4,5]};

B:{1:[],2:[0.5],3:[],4:[],5:[]};

P:{1:[2],2:[],3:[],4:[],5:[]};

步骤3.2:

(1)B中红方小兵1被击毙的概率最小,概率为0,故对红方小兵1分火力,蓝方小兵3可以攻击红方小兵1,故将蓝方小兵3的火力分配到红方小兵1上,A、B、P的取值更新为如下:

A:{1:[],2:[2,4],3:[],4:[3,4,5],5:[4,5]};

B:{1:[0.5],2:[0.5],3:[],4:[],5:[]};

P:{1:[2],2:[],3:[1],4:[],5:[]};

(2)B中红方小兵3被击毙的概率最小,概率为0,故对红方小兵3分火力,蓝方小兵4可以攻击红方小兵3,故将蓝方小兵4的火力分配到红方小兵3上,A、B、P的取值更新为如下:

A:{1:[],2:[2,4],3:[],4:[],5:[4,5]};

B:{1:[0.5],2:[0.5],3:[0.5],4:[],5:[]};

P:{1:[2],2:[],3:[1],4:[3],5:[]};

(3)B中红方小兵4被击毙的概率最小,概率为0,故对红方小兵4分火力,蓝方小兵2可以攻击红方小兵4,故将蓝方小兵2的火力分配到红方小兵4上,A、B、P的取值更新为如下:

A:{1:[],2:[],3:[],4:[],5:[4,5]};

B:{1:[0.5],2:[0.5],3:[0.5],4:[0.5],5:[]};

P:{1:[2],2:[4],3:[1],4:[3],5:[]};

(4)B中红方小兵5被击毙的概率最小,概率为0,故对红方小兵5分火力,蓝方小兵5可以攻击红方小兵5,故将蓝方小兵5的火力分配到红方小兵5上,A、B、P的取值更新为如下:

A:{1:[],2:[],3:[],4:[],5:[]};

B:{1:[0.5],2:[0.5],3:[0.5],4:[0.5],5:[0.5]};

P:{1:[2],2:[4],3:[1],4:[3],5:[5]};

(5)蓝方的火力全部被分配完毕,P即为蓝方的火力分配策略。

本发明属于人工智能中的博弈决策领域,具体为在多对多的智能体协同作战中针对智能体火力分配的问题进行求解的方法,最终形成有效的博弈策略求解方法,为智能体有效掌握战场态势、合理分配侦测资源、为作战单元提供信息支持。

进一步地,如图3所示,基于上述面向多对多智能体协同作战场景的火力分配方法,本发明还相应提供了一种面向多对多智能体协同作战场景的火力分配系统,其中,所述面向多对多智能体协同作战场景的火力分配系统包括:

想定确认模块51,用于确定红蓝对抗问题想定,所述红蓝对抗问题想定包括红蓝对抗单元的种类、数量、射击间隔及对抗问题、红蓝双方的目标任务和胜负判断准则;

建模转化模块52,用于基于语义的想定建模,将所述红蓝对抗问题想定进行结构化抽象,并将博弈对抗问题的图像信息转化为语义信息;

火力计算模块53,用于基于语义态势认知模块计算火力分配方案,并将所有我方单位指定打击对象;

生成执行模块54,用于构建语义体系,基于向量化火力打击结果生成火力打击对象决策语义,并执行当前决策指令。

进一步地,如图4所示,基于上述面向多对多智能体协同作战场景的火力分配方法和系统,本发明还相应提供了一种终端,所述终端包括处理器10、存储器20及显示器30。图4仅示出了终端的部分组件,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。

所述存储器20在一些实施例中可以是所述终端的内部存储单元,例如终端的硬盘或内存。所述存储器20在另一些实施例中也可以是所述终端的外部存储设备,例如所述终端上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器20还可以既包括所述终端的内部存储单元也包括外部存储设备。所述存储器20用于存储安装于所述终端的应用软件及各类数据,例如所述安装终端的程序代码等。所述存储器20还可以用于暂时地存储已经输出或者将要输出的数据。在一实施例中,存储器20上存储有面向多对多智能体协同作战场景的火力分配程序40,该面向多对多智能体协同作战场景的火力分配程序40可被处理器10所执行,从而实现本申请中面向多对多智能体协同作战场景的火力分配方法。

所述处理器10在一些实施例中可以是一中央处理器(Central Processing Unit,CPU),微处理器或其他数据处理芯片,用于运行所述存储器20中存储的程序代码或处理数据,例如执行所述面向多对多智能体协同作战场景的火力分配方法等。

所述显示器30在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。所述显示器30用于显示在所述终端的信息以及用于显示可视化的用户界面。所述终端的部件10-30通过系统总线相互通信。

在一实施例中,当处理器10执行所述存储器20中面向多对多智能体协同作战场景的火力分配程序40时实现面向多对多智能体协同作战场景的火力分配方法的步骤。

本发明还提供一种计算机可读存储介质,其中,所述计算机可读存储介质存储有面向多对多智能体协同作战场景的火力分配程序,所述面向多对多智能体协同作战场景的火力分配程序被处理器执行时实现如上所述的面向多对多智能体协同作战场景的火力分配方法的步骤。

有益效果:

(1)本发明提出了面向多智能体群体对抗的概率攻击火力分配方法,可以解决此类问题的一般性求解。

(2)本发明基于语义的想定建模,将想定进行结构化抽象,将博弈对抗问题的图像信息转化为语义信息,通过语义矩阵进行表达;相较于传统的图像输入模式,该方法可以极大减小系统输入输出的数据规模,提升运行效率。

(3)应用本发明方法可以解决复杂环境下多智能体对抗中的算法复杂度与智能体数量指数型关联的问题,提出了一种线性时间关联的火力分配求解算法,用于求解时间受限的博弈决策问题。

(4)本发明寻找到了一种火力分配策略,使得敌方的期望损伤最大,尽可能地将火力均匀分配到各个敌方上,使得每一个火力都最大化地得到利用。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者终端中还存在另外的相同要素。

当然,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关硬件(如处理器,控制器等)来完成,所述的程序可存储于一计算机可读取的计算机可读存储介质中,所述程序在执行时可包括如上述各方法实施例的流程。其中所述的计算机可读存储介质可为存储器、磁碟、光盘等。

应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号