首页> 中国专利> 一种基于多Agent的分布式推演仿真系统与方法

一种基于多Agent的分布式推演仿真系统与方法

摘要

本发明提出了一种基于多Agent的分布式推演仿真系统与方法,所述的基于多Agent的分布式推演仿真系统包括数据通信链路、推演配置与统计分析计算机、环境信息管理计算机、环境主控系统计算机和分布式推演Agent计算机。该基于多Agent的分布式推演仿真系统可以实现自主感知战场环境状态、自主决策和行为输出,可以选择不同的推演Agent模型,对于某些新型作战武器或装备,只需模块化更改相应作战武器库,或者将全新的装备信息以固定格式加载到作战武器库中,即具备可扩充特性并具有通用性的作战仿真系统,用以验证多种、新型的作战武器性能。

著录项

  • 公开/公告号CN101908085A

    专利类型发明专利

  • 公开/公告日2010-12-08

    原文格式PDF

  • 申请/专利权人 北京航空航天大学;

    申请/专利号CN201010220225.X

  • 申请日2010-06-28

  • 分类号G06F17/50(20060101);H04L29/06(20060101);

  • 代理机构11121 北京永创新实专利事务所;

  • 代理人官汉增

  • 地址 100191 北京市海淀区学院路37号

  • 入库时间 2023-12-18 01:18:04

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-06-11

    未缴年费专利权终止 IPC(主分类):G06F17/50 授权公告日:20120905 终止日期:20180628 申请日:20100628

    专利权的终止

  • 2012-09-05

    授权

    授权

  • 2011-01-19

    实质审查的生效 IPC(主分类):G06F17/50 申请日:20100628

    实质审查的生效

  • 2010-12-08

    公开

    公开

说明书

技术领域

本发明属于计算机仿真技术领域,具体涉及一种基于多Agent的分布式推演仿真系统与方法。

背景技术

现代战场仿真系统对于新武器装备性能测试、战争舆情推演、作战人员军事训练等起着至关重要的作用。现代战场是高度复杂的非线性系统,具有可变的战场环境、过多的动态因素干扰、多样的作战任务的,差异性的个体行为模型及复杂的人在系统决策。国外对作战仿真系统的研究时间较早,最具代表性的就是美军联合建模与仿真系统JMASS、联合仿真系统JSMIS和联合作战系统JWARS。

多Agent技术是一种非线性系统建模方法,利用具备约束关系的多Agent系统建立战场群体模型,是当前作战仿真系统的最新研究方向。近年来引入到作战系统建模中,并很快成为研究热点,国外近些年来进行了大量研究工作,例如美国海军分析中心提出了ISAAC系统模型;此外一些独立研究机构也提出了多Agent仿真系统的构建模型,如UTSAF等。国外军事仿真系统的建立,具备复杂的通信协议和固定的模型,构造困难,且不具备通用性。北京航空航天大学、国防科技大学等也都在致力于相关领域的研究,但总的来说,国内对基于多Agent技术的作战仿真系统的研究尚处于初级阶段,无论是在理论上还是在实践上同国外相比都有不小的差距,目前尚无一种通用的仿真系统与方法。

发明内容

本发明提出了一种基于多Agent的分布式推演仿真系统及仿真方法,所述的基于多Agent的分布式推演仿真系统(以下简称仿真系统)包括数据通信链路、推演配置与统计分析计算机、环境信息管理计算机、环境主控系统计算机和若干台分布式推演Agent计算机。

所述的数据通信链路采用以太网通信方式,实现推演配置与统计分析计算机、环境信息管理计算机、环境主控系统计算机和若干台分布式推演Agent计算机之间的数据传输;数据通信采用基于TCP/IP协议的服务器一客户端形式,推演配置与统计分析计算机、环境信息管理计算机、环境主控系统计算机和若干台分布式推演Agent计算机有不同的IP地址,通过点对点进行信息收发。

所述的推演配置与统计分析计算机用于配置作战任务、战场环境以及推演Agent模型及数量,生成配置信息并将配置信息下发到环境信息管理计算机、环境主控系统计算机和分布式推演Agent计算机来对其进行初始化,并发布“暂停、继续、开始”命令到环境主控系统计算机,控制仿真系统的运行;同时推演配置与统计分析计算机接收环境信息管理计算机发送的的数据分析与统计请求信息,进行解析得到全局情势,判断仿真全过程是否结束;

所述的环境主控系统计算机主要功能为控制仿真系统的仿真时序和完成Agent行为信息的解析和输出,具体为接收分布式推演Agent计算机发送的Agent感知请求信息,并将多条Agent感知请求信息组合为Agent感知请求信息列表发送给环境信息管理计算机,经过环境信息管理计算机匹配后生成Agent感知信息,再经由环境主控系统计算机转发到分布式推演Agent计算机;环境主控系统计算接收到分布式推演Agent计算机向其发送的Agent行为信息,进行解析和效果判定后输出Agent属性更新信息、环境更新信息和Agent任务信息;将上述三种信息发送到环境信息管理计算机供其更新和存储;同时将Agent属性更新信息发送到分布式推演Agent计算机;

所述的环境信息管理计算机接收来自环境主控系统计算机发送的Agent感知请求信息列表,进行匹配生成的Agent感知信息,并将该Agent感知信息通过环境主控系统计算机发送到分布式推演Agent计算机进行感知;环境信息管理计算机接收环境主控系统计算机发送的Agent属性更新信息、环境更新信息和Agent任务信息,接收到的Agent属性更新信息和环境更新信息用于更新全局映像库和环境信息库;接收的Agent任务信息进行存储后发送到分布式推演Agent计算机;

所述的分布式推演Agent计算机在仿真全过程中模拟独立的推演Agent实体,向环境主控计算机发送Agent感知请求信息,该信息经过匹配后生成固定格式的Agent感知信息并经由环境主控计算机再发回该分布式推演Agent计算机进行感知;分布式推演Agent计算机接收环境主控系统计算机发送的Agent属性更新信息,接收环境信息管理计算机发送的Agent任务信息,执行自主行为或外部控制的行为输出,并经解析后输出Agent行为信息到环境主控系统计算机。

本发明的推演配置与统计分析计算机组成包括配置文件生成模块、配属Agent模型库、传感器库、武器装备库、战场环境信息库、全局仿真步骤控制模块、通信模块A、战局显示模块和数据解析模块。推演配置与统计分析计算机的可以实现以下三种功能:

(1)仿真全过程开始前管理员查询和设置配属Agent模型库、传感器库和武器装备库和战场环境信息库后确定参演的战场环境模型;设置单步仿真运行的单步步长,通过配置文件生成模块生成配置信息;并通过通信模块A下发到环境信息管理计算机、环境主控系统计算机和各台分布式推演Agent计算机;

(2)仿真全过程的步骤控制:仿真全过程开始后,管理员通过全局仿真步骤控制模块完成对仿真全过程的监控,并通过下发“暂停、继续、开始”命令到环境主控系统计算机,控制仿真系统的各个单步仿真运行的暂停、继续和开始;

(3)全局战局显示和数据解析:仿真全过程开始后管理员通过战局显示模块对仿真全过程进行的实时监视和战况分析;通信模块A接收环境信息管理计算机发送的数据分析与统计请求信息后经数据解析模块解析并计算战况,判断仿真全过程是否完成。

本发明的环境信息管理计算机结构包括通信模块B、Agent感知请求解析模块、全局映像信息库、环境信息库、信息匹配模块及Agent感知限定条件数据库,所述的Agent感知限定条件数据库包括Agent注册信息库、地形环境信息库和传感器信息库。

该环境信息管理计算机的实现流程为:(1)通信模块B接收环境主控系统计算机发送的Agent感知请求信息列表,再由通信模块B到达Agent感知请求解析模块中进行解析,得到Agent感知请求信息类型、信息参数及发送请求的Agent ID;其中Agent感知请求信息列表是由多个Agent感知请求信息构成的;(2)Agent感知请求信息经Agent感知请求解析模块解析后,到达信息匹配模块,信息匹配模块根据Agent感知请求信息类型、信息参数和Agent ID分别查询Agent感知限定条件数据库、环境信息库和全局映像信息库,开始对Agent感知请求信息进行信息匹配;并且全局映像信息库存储当前分布式推演Agent计算机状态,环境信息库存储当前战场环境信息;信息匹配后生成固定格式的Agent感知信息;经由通信模块B发送到环境主控系统计算机;(3)通信模块B接收环境主控系统计算机发送的Agent任务信息后进行存储,该Agent任务信息存储后经由通信模块B发送到到分布式推演Agent计算机;再经由通信模块B接收环境主控系统计算机发送的Agent属性更新信息和环境更新信息,实时更新其全局映像信息库和环境信息库;(4)通信模块B接收环境主控系统计算机发送的数据分析与统计请求,查询全局映像信息库和环境信息库,获得到数据分析与统计请求信息,并将该信息经由通信模块B发送到推演配置与统计分析计算机。

所述的地形环境信息库、Agent注册信息库和传感器信息库均为模块化数据库,根据不同的作战需求可以扩充其数据内容,具备仿真平台的通用性特征。

本发明的环境主控系统计算机包括Agent行为效果判定模块和系统通信控制模块;所述的Agent行为效果判定模块结构包括词义语法分析器、注册Agent信息库、行为效果函数规则库、机动性能库、武器性能库及计时器,效果寄存器、效果执行器、通信模块D、效果判定模块及自动演化环境库。

所述的Agent行为效果判定模块的实现流程为:

(1)通信模块D接收分布式推演Agent计算机发出的Agent行为信息,,到达词义语法分析器解析后,到达效果判定模块

(2)效果判定模块查询自动演化环境库,得到行为输出标准信息对应的具体环境信息;查询注册Agent信息库,得到行为输出标准信息里的Agent ID对应所需Agent信息;效果判定模块查询武器性能库,得到Agent配备武器信息、火力强度函数、克制装甲列表、对环境影响函数列表和武器攻击频率;效果判定模块查询机动性能库,得到Agent机动行为输出参数;效果判定模块查询行为效果函数规则库,得到Agent攻击行为效果信息或Agent通信行为效果信息;效果判定模块查询计时器,得到当前时间,计算行为效果预计发生时间;效果判定模块经过上述查询后生成效果判定标准信息;

(3)效果判定标准信息存储于效果寄存器中;效果执行器轮询效果寄存器,效果执行器查询计时器,得到当前时间,对比效果判定标准信息中预计发生时间,预计时间到达的效果信息将被调出并转化为效果执行标准信息,根据效果执行标准信息模式的不同分为Agent属性更新信息、环境更新信息和Agent任务信息,并将这三种信息通过通信模块D发送到环境信息管理计算机中;同时将Agent属性更新信息经通信模块D发送到分布式推演Agent计算机。

所述的系统通信控制模块是数据通信链路的主控节点,其实现过程包括单步仿真运行前的初始化控制和单步仿真运行的控制;仿真全过程是由多步单步仿真运行来完成的;

所述的单步仿真运行前的初始化控制是指环境主控系统计算机读取和解析配置信息,初始化单步仿真运行单步步长和应答消息列表。所述的应答消息列表是指单步仿真运行过程中各台计算机点对点IP收发信息的顺序逻辑列表。

单步仿真运行的控制包括以下三个步骤:

(1)控制单步仿真运行的标准时间对齐:

系统通信控制模块通过TCP/IP协议,点对点的发送单步仿真运行的标准时间到推演配置与统计分析计算机、环境信息管理计算机和分布式推演Agent计算机;

推演配置与统计分析计算机、环境信息管理计算机和分布式推演Agent计算机,接收到时间对齐信号之后,统一将各自的计算机的单步仿真运行的时间统一初始化为接收到的单步仿真运行的标准时间;

(2)单步仿真运行的仿真系统通信测试:

系统通信控制模块向推演配置与统计分析计算机、环境信息管理计算机和若干台分布式推演Agent计算机发送控制触发信号后,推演配置与统计分析计算机、环境信息管理计算机和分布式推演Agent计算机向系统通信控制模块回馈控制触发信号信息;若系统通信控制模块接收的所有回馈控制触发信号信息正常,则单步仿真运行开始,若系统通信控制模块接收的任一回馈控制触发信号信息有误,排查错误,重新发送控制触发信号,直至系统通信控制模块接收到所有回馈控制触发信号无误;

(3)控制单步仿真运行时序:

单步仿真运行开始后,控制以下四个时序:

(A)提出感知要求运行子时序:系统通信控制模块接收分布式推演Agent计算机发送的Agent感知信息请求信息,并将得到多条Agent感知请求信息组合为Agent感知请求信息列表;并将该列表发送到环境信息管理计算机;

(B)获得Agent感知信息子时序:环境信息管理计算机将得到的Agent感知请求信息列表中的Agent感知请求信息进行匹配,并将匹配后生成的固定格式的Agent感知信息,经由系统通信控制模块发送到需求感知的分布式推演Agent计算机中;

(C)行为输出运行子时序:Agent行为信息经由Agent行为效果判定模块判定后得到Agent属性更新信息、环境更新信息及Agent任务信息;系统通信控制模块将Agent属性更新信息发送到需要更新属性的分布式推演Agent计算机中,执行相应更新;系统通信控制模块将Agent属性更新信息、环境更新信息及Agent任务信息发送到环境信息管理计算机中,更新其环境信息库和全局映像信息库,存储Agent任务信息,并将Agent任务信息发送到分布式推演Agent计算机中,Agent任务信息经由行为解析模块解析后得到Agent行为信息,通过数据通信链路发往环境主控系统计算机中存储,供下一步单步仿真运行时执行;

当仿真系统执行第一步单步仿真运行时,无Agent行为信息;分布式推演Agent计算机不执行Agent任务信息,环境主控系统计算机的Agent行为效果判定模块相应也不执行判定分布式推演Agent计算机仅发送Agent行为信息供下一步单步仿真运行时进行判定及执行。

(D)战况统计分析子时序:系统通信控制模块得到数据分析与统计请求,并将其发送到环境信息管理计算机,经查询处理后获得数据分析与统计请求信息,并将该信息发送到推演配置与统计分析计算机。

本发明的分布式推演Agent计算机包括通信模块C、固定属性库、可变属性库、感知模块、视景数据解析模块、视景显示模块、人机交互接口模块、操作数据解析模块、规则库、决策模块、任务选择模块和行为解析输出模块。

所述的分布式推演Agent计算机的实现流程为:经通信模块C发出Agent感知请求信息,经由环境信息管理计算机的匹配和环境主控系统计算机的转发之后,再经由通信模块C获得Agent感知信息,Agent感知信息到达感知模块进行感知;

经由通信模块C接收环境主控计算机发送的Agent属性更新信息用于更新可变属性库,并结合可变属性库与固有属性库,在感知模块内解析Agent感知信息得到综合数据信息;

经由通信模块C接收环境信息管理计算机发送的Agent任务信息,用于多级任务选择;决策模块根据综合数据信息,查询规则库,得到自主决策任务信息;综合数据信息通过视景数据解析模块,到达人机交互接口,得到Agent视角的环境视景,引出视频信号供操作员监视局部战场情势;操作员采取键盘或者鼠标输入操作信息控制Agent行为,操作信息经由操作数据解析模块,得到控制决策任务信息;任务选择模块结合Agent任务信息、自主决策任务信息和控制决策任务信息选择最终任务,所选任务经由行为解析模块解析后得到Agent行为信息,由通信模块C通过数据通信链路发往环境主控系统计算机,供下一步单步仿真运行时执行;第一步单步仿真运行时没有Agent行为信息,环境主控系统计算机的Agent行为效果判定模块相应不执行Agent行为信息判定。

一种基于多Agent的分布式推演仿真方法,主要包括以下几个步骤:

步骤一:仿真全过程开始前的测试、连接工作:

(a)管理员通过推演配置与统计分析计算机制定战场战术目标,从战场环境库中选择战场环境,从推演Agent模型库中选择作战推演Agent类型与数量,设置单步仿真运行步长,

(b)激活各台分布式推演Agent计算机的外部接口属性,定义各Agent映射的分布式推演Agent计算机的网络IP地址,并生成配置信息,开启数据通信链路;

(c)测试数据通信链路是否畅通:如果数据通信链路不通畅,检查网络配置,返回步骤(b);

如果数据通信链路畅通,则将配置信息经由数据通信链路发送到各台分布式推演Agent计算机、环境主控系统计算机和环境信息管理计算机;各台分布式推演Agent计算机、环境主控系统计算机和环境信息管理计算机根据配置信息进行初始化;

各台分布式推演Agent计算机需要初始化本机对应的推演Agent模型属性,包括固有属性、可变属性和决策库以及本机对应的网络地址;

环境主控系统计算机需要初始化系统通信控制模块,通过读取配置信息,初始化单步仿真运行步长,设置应答消息列表;

环境信息管理计算机需要初始化全局Agent映像信息库、环境信息库、Agent感知判定模块、地形环境信息库、Agent注册信息库和传感器信息库;所述的测试数据通信链路是指测试整个分布式推演仿真系统各种时序的数据通道是否畅通;

(d)整个分布式推演仿真系统配置回馈验证:推演配置与统计分析计算机接收各台分布式推演Agent计算机、环境信息管理计算机和环境主控系统计算机的配置回馈信息,进行匹配配置信息;若配置回馈信息匹配,等待管理员发布开始仿真全过程的运行触发指令;否则排查错误配置回馈信息,推演配置与统计分析计算机重新发送配置信息并接收配置回馈信息,直到全部配置回馈信息匹配;

所述的仿真全过程是由多步单步仿真运行过程完成的;

步骤二:管理员发布仿真全过程运行触发指令;

步骤三:单步仿真运行标准时间对齐

系统通信控制模块通过TCP/IP协议,点对点的发送单步仿真运行的标准时间到推演配置与统计分析计算机、环境信息管理计算机和若干台分布式推演Agent计算机后,将各台计算机的单步仿真运行时间统一初始化为接收到的单步仿真标准时间,开始运行单步仿真;

步骤四:单步仿真运行前仿真系统通信测试:

系统通信控制模块向推演配置与统计分析计算机、环境信息管理计算机和若干台分布式推演Agent计算机发送控制触发信号后,收到推演配置与统计分析计算机、环境信息管理计算机和若干台分布式推演Agent计算机回馈的控制触发信号信息;若回馈控制触发信号信息正常,则开始单步仿真运行,若回馈控制触发信号信息有误,排查错误,重新发送控制出发信号,直至系统通信控制模块接收到所有回馈控制触发信号无误;

步骤五:单步仿真运行:

(A)提出感知要求运行子时序:系统通信控制模块接收分布式推演Agent计算机发送的Agent感知信息请求信息,并通过系统通信控制模块将多个Agent感知信息请求信息构成的Agent感知信息请求信息该列表发送到环境信息管理计算机;

(B)获得Agent感知信息子时序:环境信息管理计算机将得到的Agent感知请求信息列表中的Agent感知请求信息进行匹配,并将匹配后生成的固定格式的Agent感知信息,经由系统通信控制模块发送到需求感知的分布式推演Agent计算机中;

(C)行为输出运行子时序:Agent行为信息经由Agent行为效果判定模块判定后得到Agent属性更新信息、环境更新信息及Agent任务信息;系统通信控制模块将Agent属性更新信息发送到需要更新属性的分布式推演Agent计算机中,执行相应更新;系统通信控制模块将Agent属性更新信息、环境更新信息及Agent任务信息发送到环境信息管理计算机中,更新其环境信息库和全局映像信息库,存储Agent任务信息,并将Agent任务信息发送到分布式推演Agent计算机中,Agent任务信息经由行为解析模块解析后得到Agent行为信息,通过数据通信链路发往环境主控系统计算机,供下一步单步仿真运行时执行;

当仿真系统执行第一步单步仿真运行时,无Agent行为信息,分布式推演Agent计算机不执行Agent任务信息,仅发送Agent行为信息供下一步单步仿真运行时执行;

(D)战况统计分析子时序:系统通信控制模块得到数据分析与统计请求,并将其发送到环境信息管理计算机,经查询处理后获得数据分析与统计请求信息,并将该信息发送到推演配置与统计分析计算机。

步骤六:判断仿真全过程是否结束:

推演配置与统计分析计算机判断仿真全过程是否结束,如果是,结束仿真全过程;如果否,推演配置与统计分析计算机发布继续运行下一步单步仿真命令到环境主控系统计算机,环境主控系统计算机接收到下一步单步仿真运行命令信号后,返回步骤三。

本发明的优点在于:

(1)本发明中的分布式推演Agent计算机可以实现自主感知战场环境状态、自主决策和行为输出。并且分布式推演Agent计算机具备人机交互接口模块,可以让操作人员以推演Agent视角感知战场态势,并控制该对应推演Agent采取对应决策行为。

(2)本发明具备多台分布式推演Agent计算机,可以实现战场集群作战仿真。推演配置与统计分析计算机可以全局监控战场情势;并通过内置分析规则解析战场情势。在仿真过程中,操作员可以采取暂停、停止、继续等指令,控制整个分布式推演仿真系统仿真运行。

(3)本发明中采用以太网通信实施方式的数据通信链路;可以方便的扩充网络节点,扩充分布式推演Agent群体作战数目,同时还可以实现跨地域的分布式仿真。

(4)本发明中分布式推演Agent运行步骤包含环境感知、自主决策和行为输出三个步骤,并且各台分布式推演Agent计算机的并行时序由环境主控系统计算机的系统通信控制模块控制,即以环境主控系统计算机的系统通信控制模块作为通信总控制器,分时序收发全局信息、控制各台分布式推演Agent计算机从先“感知”到“行为输出”的逻辑顺序,简化了战场信息流,减轻网络的信息负载。

(5)在推演配置与统计分析计算机上,可以设置仿真步长,并从战场环境库中选择加载不同的战场环境,也可以选择不同的推演Agent模型,对于某些新型作战武器或装备,只需模块化更改相应作战武器库,或者将全新的装备信息以固定格式加载到作战武器库中,即具备可扩充特性并具有通用性的作战仿真系统,用以验证多种、新型的作战武器性能。

(6)本发明采用推演配置与统计分析计算机的总控特性可以实现战场仿真过程的全局控制,方便管理;同时具有分析规则库解析全局战场情势,方便分析判定。

附图说明

图1:基于多Agent的分布式推演仿真系统结构图;

图2:环境信息管理计算机结构及实现流程图;

图3:Agent行为效果判定模块结构及实现流程图;

图4-A:单步仿真运行控制A图;

图4-B:单步仿真运行控制B图;

图5:分布式推演Agent计算机结构及实现流程图;

图6:基于多Agent的分布式推演仿真方法流程图。

具体实施方式

下面将结合附图对本发明作进一步详细说明。

本发明提出了一种基于多Agent的分布式推演仿真系统(以下简称为仿真系统),如图1所示,包括数据通信链路、推演配置与统计分析计算机、环境信息管理计算机、环境主控系统计算机和若干台分布式推演Agent计算机。

所述的数据通信链路采用以太网通信方式,实现推演配置与统计分析计算机、环境信息管理计算机、环境主控系统计算机和若干台分布式推演Agent计算机之间的数据传输;数据通信采用基于TCP/IP协议的服务器-客户端形式,推演配置与统计分析计算机、环境信息管理计算机、环境主控系统计算机和若干台分布式推演Agent计算机有不同的IP地址,通过点对点进行信息收发。

所述的推演配置与统计分析计算机用于配置作战任务、战场环境以及推演Agent模型及数量,生成配置信息并将配置信息下发到环境信息管理计算机、环境主控系统计算机和分布式推演Agent计算机来对其进行初始化,并发布“暂停、继续、开始”命令到环境主控系统计算机,控制仿真系统的运行;同时推演配置与统计分析计算机接收环境信息管理计算机发送的的数据分析与统计请求信息,进行解析得到全局情势,判断仿真全过程是否结束;

所述的环境主控系统计算机主要功能为控制仿真系统的仿真时序和完成Agent行为信息的解析和输出,具体为接收分布式推演Agent计算机发送的Agent感知请求信息,并将多条Agent感知请求信息组合为Agent感知请求信息列表发送给环境信息管理计算机,经过环境信息管理计算机匹配后生成Agent感知信息,再经由环境主控系统计算机转发到分布式推演Agent计算机;环境主控系统计算接收到分布式推演Agent计算机向其发送的Agent行为信息,进行解析和效果判定后输出Agent属性更新信息、环境更新信息和Agent任务信息;将上述三种信息发送到环境信息管理计算机供其更新和存储;同时将Agent属性更新信息发送到分布式推演Agent计算机;

所述的环境信息管理计算机接收来自环境主控系统计算机发送的Agent感知请求信息列表,进行匹配生成的Agent感知信息,并将该Agent感知信息通过环境主控系统计算机发送到分布式推演Agent计算机进行感知;环境信息管理计算机接收环境主控系统计算机发送的Agent属性更新信息、环境更新信息和Agent任务信息,接收到的Agent属性更新信息和环境更新信息用于更新全局映像库和环境信息库;接收的Agent任务信息进行存储后发送到分布式推演Agent计算机;

所述的分布式推演Agent计算机在仿真全过程中模拟独立的推演Agent实体,向环境主控计算机发送Agent感知请求信息,该信息经过匹配后生成固定格式的Agent感知信息并经由环境主控计算机再发回该分布式推演Agent计算机进行感知;分布式推演Agent计算机接收环境主控系统计算机发送的Agent属性更新信息,接收环境信息管理计算机发送的Agent任务信息,执行自主行为或外部控制的行为输出,并经解析后输出Agent行为信息到环境主控系统计算机。

本发明的推演配置与统计分析计算机组成包括配置文件生成模块、配属Agent模型库、传感器库、武器装备库、战场环境信息库、全局仿真步骤控制模块、通信模块A、战局显示模块和数据解析模块。推演配置与统计分析计算机的可以实现以下三种功能:

(1)仿真全过程开始前管理员查询和设置配属Agent模型库、传感器库和武器装备库和战场环境信息库后确定参演的战场环境模型;管理员设置单步仿真运行的单步步长,通过配置文件生成模块生成配置信息;并通过通信模块A下发到环境信息管理计算机、环境主控系统计算机和各台分布式推演Agent计算机;

(2)仿真全过程的步骤控制:仿真全过程开始后,管理员通过全局仿真步骤控制模块完成对仿真全过程各个单步仿真运行的监控,管理员并通过通信模块A下发“暂停、继续、开始”命令到环境主控系统计算机,控制仿真系统的各个单步仿真运行的暂停、继续和开始;

(3)全局战局显示和数据解析:仿真全过程开始后管理员对仿真全过程的监视和战况分析,仿真全过程通过战局显示模块完成实时显示;通信模块A接收环境信息管理计算机发送的数据分析与统计请求信息后经数据解析模块解析并计算战况,判断仿真全过程是否完成。

本发明的环境信息管理计算机结构和实现流程如图2所示,包括通信模块B、Agent感知请求解析模块、全局映像信息库、环境信息库、信息匹配模块及Agent感知限定条件数据库,所述的Agent感知限定条件数据库包括Agent注册信息库、地形环境信息库和传感器信息库。该环境信息管理计算机的实现流程为:(1)通信模块B接收环境主控系统计算机发送的Agent感知请求信息列表,再由通信模块B到达Agent感知请求解析模块中进行解析,得到Agent感知请求信息类型、信息参数及发送请求的Agent ID;其中Agent感知请求信息列表是由多个Agent感知请求信息构成的;(2)Agent感知请求信息经Agent感知请求解析模块解析后,到达信息匹配模块,信息匹配模块根据Agent感知请求信息类型、信息参数和Agent ID分别查询Agent感知限定条件数据库、环境信息库和全局映像信息库,开始对Agent感知请求信息进行信息匹配;并且全局映像信息库存储当前分布式推演Agent计算机状态,环境信息库存储当前战场环境信息;信息匹配后生成固定格式的Agent感知信息;经由通信模块B发送到环境主控系统计算机;(3)通信模块B接收环境主控系统计算机发送的Agent任务信息后进行存储,该Agent任务信息存储后经由通信模块B发送到到分布式推演Agent计算机;再经由通信模块B接收环境主控系统计算机发送的Agent属性更新信息和环境更新信息,实时更新其全局映像信息库和环境信息库;(4)通信模块B接收环境主控系统计算机发送的数据分析与统计请求,查询全局映像信息库和环境信息库,获得到数据分析与统计请求信息,并将该信息经由通信模块B发送到推演配置与统计分析计算机。

所述的地形环境信息库、Agent注册信息库和传感器信息库均为模块化数据库,根据不同的作战需求可以扩充其数据内容,具备仿真平台的通用性特征。

本发明的环境主控系统计算机包括Agent行为效果判定模块和系统通信控制模块;所述的Agent行为效果判定模块结构及实现流程如图3所示,包括词义语法分析器、注册Agent信息库、行为效果函数规则库、机动性能库、武器性能库及计时器,效果寄存器、效果执行器、通信模块D、效果判定模块及自动演化环境库。

Agent行为效果判定模块的实现流程为:

(1)通信模块D接收分布式推演Agent计算机发出的Agent行为信息,,到达词义语法分析器解析后,到达效果判定模块

(2)效果判定模块查询自动演化环境库,得到行为输出标准信息对应的具体环境信息;查询注册Agent信息库,得到行为输出标准信息里的Agent ID对应所需Agent信息;效果判定模块查询武器性能库,得到Agent配备武器信息、火力强度函数、克制装甲列表、对环境影响函数列表和武器攻击频率;效果判定模块查询机动性能库,得到Agent机动行为输出参数;效果判定模块查询行为效果函数规则库,得到Agent攻击行为效果信息或Agent通信行为效果信息;效果判定模块查询计时器,得到当前时间,计算行为效果预计发生时间;效果判定模块经过上述查询后生成效果判定标准信息;

(3)效果判定标准信息存储于效果寄存器中;效果执行器轮询效果寄存器,效果执行器查询计时器,得到当前时间,对比效果判定标准信息中预计发生时间,预计时间到达的效果信息将被调出并转化为效果执行标准信息,根据效果执行标准信息模式的不同分为Agent属性更新信息、环境更新信息和Agent任务信息,并将这三种信息通过通信模块D发送到环境信息管理计算机中;同时将Agent属性更新信息经通信模块D发送到分布式推演Agent计算机。

效果执行标准信息划分为三种效果执行信息模式,如下表1所示:

表1  效果执行标准信息模式

 效果属性 Agent任务信息 环境更新信息 Agent属性更新信息

效果执行标准信息有三种效果类型:分别是“Agent任务信息”、“环境更新信息”和“Agent属性更新信息”。“环境更新信息”:是指将Agent对战场环境的破坏等作用输出于环境信息管理计算机的环境信息库更新环境信息;“Agent属性更新信息”将发送到目标分布式推演Agent计算机,更改其可变属性,“Agent属性更新信息”同时发送到环境信息管理计算机,更新Agent全局映像信息库;“Agent任务信息”是指Agent向目标Agent发送的任务信息指令,Agent任务信息将发送到环境信息管理计算机中存储,在下一步单步仿真运行时执行本步存储的Agent任务信息。

根据Agent行为模式分类不同,效果判定标准信息计算分为以下三种:

(1)机动行为

需要判定的是下一个时间点(更新周期ΔT)所在位置,计算公式如下:

P(t+ΔT)=f(ΔT,v,P(t),dir,others)---(1)

如公式(1)所示,下一步位置P(t+ΔT)由当前位置P(t)、Agent移动速度运动方向dir、环境地形等其余因素others决定,该行为的实现具有即时性,并属于不可打断类型,具体计算方法在武器性能库内存储。

(2)攻击行为

攻击行为主要解决的是目标更新效果和目标更新时间问题。对于目标更新效果,即被损伤的程度。目标损伤计算函数如下:

D=g(d,p,style,others)    (2)

如式(2),目标的损伤判定涉及目标Agent位置(距离,d),所处地形p、攻击Agent火力类型style,其余因素others包含攻击武器射击精度、攻击武器的发射频率、被攻击对象的装甲类型等。对于大多数攻击来讲,行为输出的作用时间极短,可做立即生效处理;但对于某些攻击,如手雷、低速导弹等,其效果产生有较大时滞,且有可能被打断,这需要相关计算处理。具体计算方法与武器装备对应,以可扩充数据库的形式存储。

例如:反坦克导弹攻击到达时间:

t=f(p(Agent),p(Target),v,other)---(3)

由公式(3),t由目标距离(p(Agent)、p(T arg et))、导弹速度和其他因素other决定,具体计算参数在武器性能库内存储。。

(3)通信行为

通信行为指Agent之间的信息交互,包含上级Agent与下级Agent的命令指令以及平级Agent之间的任务协作指令。所有Agent之间的(包括上级Agent、下级Agent和平级Agent)通信交互行为以环境信息管理计算机为中介,即将通信信息发送到环境信息管理计算机,在推演Agent计算机向环境信息管理计算机提出感知请求并获得感知信息、同时接收到任务信息。通信内容根据实际战场形式确定。

经过效果判定系统后,Agent的三种行为信息均转化为“效果判定标准”形式(见表2),存储到效果寄存器中。

表2  效果判定标准表

  模式  发生时间  更新内容  更新效果  可打断

表2中“模式”是指机动行为、攻击行为或通信行为中的一种,见表2所示;“发生时间”是指计算得到的该行为预计发生时间,“更新内容”表示行为效果的作用对象(具体环境、具体Agent、弹药等);“更新效果”是指行为效果的作用形式(环境破坏程度、Agent生命损失程度、弹药消耗等),“可打断”是指该行为效果是否可以被中间过程打断。

所述的系统通信控制模块是数据通信链路的主控节点,其实现过程包括单步仿真运行前的初始化控制和单步仿真运行的控制;仿真全过程是由多步单步仿真运行来完成的;

所述的单步仿真运行前的初始化控制是指环境主控系统计算机读取和解析配置信息,初始化单步仿真运行单步步长和应答消息列表。所述的应答消息列表是指单步仿真运行过程中各台计算机点对点IP收发信息的顺序逻辑列表。

单步仿真运行的控制包括以下三个步骤:

(1)控制单步仿真运行的标准时间对齐:

系统通信控制模块通过TCP/IP协议,点对点的发送单步仿真运行的标准时间到推演配置与统计分析计算机、环境信息管理计算机和分布式推演Agent计算机;

推演配置与统计分析计算机、环境信息管理计算机和分布式推演Agent计算机,接收到时间对齐信号之后,统一将各自的计算机的单步仿真运行的时间统一初始化为接收到的单步仿真运行的标准时间;

(2)单步仿真运行的仿真系统通信测试:

系统通信控制模块向推演配置与统计分析计算机、环境信息管理计算机和若干台分布式推演Agent计算机发送控制触发信号后,推演配置与统计分析计算机、环境信息管理计算机和分布式推演Agent计算机向系统通信控制模块回馈控制触发信号信息;若系统通信控制模块接收的所有回馈控制触发信号信息正常,则单步仿真运行开始,若系统通信控制模块接收的任一回馈控制触发信号信息有误,排查错误,重新发送控制触发信号,直至系统通信控制模块接收到所有回馈控制触发信号无误;

(3)控制单步仿真运行时序:

单步仿真运行开始后,控制以下四个时序,如图4-A和图4-B所示:

(A)提出感知要求运行子时序:系统通信控制模块接收分布式推演Agent计算机发送的Agent感知信息请求信息,并将得到多条Agent感知请求信息组合为Agent感知请求信息列表;并将该列表发送到环境信息管理计算机;

(B)获得Agent感知信息子时序:环境信息管理计算机将得到的Agent感知请求信息列表中的Agent感知请求信息进行匹配,并将匹配后生成的固定格式的Agent感知信息,经由系统通信控制模块发送到需求感知的分布式推演Agent计算机中;

(C)行为输出运行子时序:Agent行为信息经由Agent行为效果判定模块判定后得到Agent属性更新信息、环境更新信息及Agent任务信息;系统通信控制模块将Agent属性更新信息发送到需要更新属性的分布式推演Agent计算机中,执行相应更新;系统通信控制模块将Agent属性更新信息、环境更新信息及Agent任务信息发送到环境信息管理计算机中,更新其环境信息库和全局映像信息库,存储Agent任务信息,并将Agent任务信息发送到分布式推演Agent计算机中,Agent任务信息经由行为解析模块解析后得到Agent行为信息,通过数据通信链路发往环境主控系统计算机中存储,供下一步单步仿真运行时执行;

当仿真系统执行第一步单步仿真运行时,无Agent行为信息;分布式推演Agent计算机不执行Agent任务信息,环境主控系统计算机的Agent行为效果判定模块相应也不执行判定;分布式推演Agent计算机仅发送Agent行为信息,供下一步单步仿真运行时进行判定及执行。

(D)战况统计分析子时序:系统通信控制模块得到数据分析与统计请求,并将其发送到环境信息管理计算机,经查询处理后获得数据分析与统计请求信息,并将该信息发送到推演配置与统计分析计算机。

本发明的分布式推演Agent计算机结构和实现流程如图5所示,包含通信模块C、固定属性库、可变属性库、感知模块、视景数据解析模块、视景显示模块、人机交互接口模块、操作数据解析模块、规则库、决策模块、任务选择模块和行为解析输出模块。

所述的分布式推演Agent计算机的实现流程为:经通信模块C发出Agent感知请求信息,经由环境信息管理计算机的匹配和环境主控系统计算机的转发之后,再经由通信模块C获得Agent感知信息,Agent感知信息到达感知模块进行感知;

经由通信模块C接收环境主控计算机发送的Agent属性更新信息用于更新可变属性库,并结合可变属性库与固有属性库,在感知模块内解析Agent感知信息得到综合数据信息;

经由通信模块C接收环境信息管理计算机发送的Agent任务信息,用于多级任务选择;决策模块根据综合数据信息,查询规则库,得到自主决策任务信息;综合数据信息通过视景数据解析模块,到达人机交互接口,得到Agent视角的环境视景,引出视频信号供操作员监视局部战场情势;操作员采取键盘或者鼠标输入操作信息控制Agent行为,操作信息经由操作数据解析模块,得到控制决策任务信息;任务选择模块结合Agent任务信息、自主决策任务信息和控制决策任务信息选择最终任务,所选任务经由行为解析模块解析后得到Agent行为信息,由通信模块C通过数据通信链路发往环境主控系统计算机,供下一步单步仿真运行时执行;第一步单步仿真运行时没有Agent行为信息,环境主控系统计算机的Agent行为效果判定模块相应不执行Agent行为信息判定。

一种基于多Agent的分布式推演仿真方法如图6所示,该方法基于上述的基于多Agent的分布式推演仿真平台,主要包括以下几个步骤:

步骤一:仿真全过程开始前的测试、连接工作:

(a)管理员通过推演配置与统计分析计算机制定战场战术目标,从战场环境库中选择战场环境,从推演Agent模型库中选择作战推演Agent类型与数量,设置单步仿真运行步长,

(b)激活各台分布式推演Agent计算机的外部接口属性,定义各Agent映射的分布式推演Agent计算机的网络IP地址,并生成配置信息,开启数据通信链路;

(c)测试数据通信链路是否畅通:如果数据通信链路不通畅,检查网络配置,返回步骤(b);

如果数据通信链路畅通,则将配置信息经由数据通信链路发送到各台分布式推演Agent计算机、环境主控系统计算机和环境信息管理计算机;各台分布式推演Agent计算机、环境主控系统计算机和环境信息管理计算机根据配置信息进行初始化;

各台分布式推演Agent计算机需要初始化本机对应的推演Agent模型属性,包括固有属性、可变属性和决策库以及本机对应的网络地址;

环境主控系统计算机需要初始化系统通信控制模块,通过读取配置信息,初始化单步仿真运行步长,设置应答消息列表;

环境信息管理计算机需要初始化全局Agent映像信息库、环境信息库、Agent感知判定模块、地形环境信息库、Agent注册信息库和传感器信息库;所述的测试数据通信链路是指测试整个分布式推演仿真系统各种时序的数据通道是否畅通;

(d)整个分布式推演仿真系统配置回馈验证:推演配置与统计分析计算机接收各台分布式推演Agent计算机、环境信息管理计算机和环境主控系统计算机的配置回馈信息,进行匹配配置信息;若配置回馈信息匹配,等待管理员发布开始仿真全过程的运行触发指令;否则排查错误配置回馈信息,推演配置与统计分析计算机重新发送配置信息并接收配置回馈信息,直到全部配置回馈信息匹配;

所述的仿真全过程是由多步单步仿真运行过程完成的;

步骤二:管理员发布仿真全过程运行触发指令;

步骤三:单步仿真运行标准时间对齐

系统通信控制模块通过TCP/IP协议,点对点的发送单步仿真运行的标准时间到推演配置与统计分析计算机、环境信息管理计算机和若干台分布式推演Agent计算机后,将各台计算机的单步仿真运行时间统一初始化为接收到的单步仿真标准时间,开始运行单步仿真;

步骤四:单步仿真运行前仿真系统通信测试:

系统通信控制模块向推演配置与统计分析计算机、环境信息管理计算机和若干台分布式推演Agent计算机发送控制触发信号后,收到推演配置与统计分析计算机、环境信息管理计算机和若干台分布式推演Agent计算机回馈的控制触发信号信息;若回馈控制触发信号信息正常,则开始单步仿真运行,若回馈控制触发信号信息有误,排查错误,重新发送控制出发信号,直至系统通信控制模块接收到所有回馈控制触发信号无误;

步骤五:单步仿真运行:

(A)提出感知要求运行子时序:系统通信控制模块接收分布式推演Agent计算机发送的Agent感知信息请求信息,并通过系统通信控制模块将多个Agent感知信息请求信息构成的Agent感知信息请求信息该列表发送到环境信息管理计算机;

(B)获得Agent感知信息子时序:环境信息管理计算机将得到的Agent感知请求信息列表中的Agent感知请求信息进行匹配,并将匹配后生成的固定格式的Agent感知信息,经由系统通信控制模块发送到需求感知的分布式推演Agent计算机中;

(C)行为输出运行子时序:Agent行为信息经由Agent行为效果判定模块判定后得到Agent属性更新信息、环境更新信息及Agent任务信息;系统通信控制模块将Agent属性更新信息发送到需要更新属性的分布式推演Agent计算机中,执行相应更新;系统通信控制模块将Agent属性更新信息、环境更新信息及Agent任务信息发送到环境信息管理计算机中,更新其环境信息库和全局映像信息库,存储Agent任务信息,并将Agent任务信息发送到分布式推演Agent计算机中,Agent任务信息经由行为解析模块解析后得到Agent行为信息,通过数据通信链路发往环境主控系统计算机,供下一步单步仿真运行时执行;

当仿真系统执行第一步单步仿真运行时,无Agent行为信息,分布式推演Agent计算机不执行Agent任务信息,仅发送Agent行为信息供下一步单步仿真运行时执行;

(D)战况统计分析子时序:系统通信控制模块得到数据分析与统计请求,并将其发送到环境信息管理计算机,经查询处理后获得数据分析与统计请求信息,并将该信息发送到推演配置与统计分析计算机。

步骤六:判断仿真全过程是否结束:

推演配置与统计分析计算机判断仿真全过程是否结束,如果是,结束仿真全过程;如果否,推演配置与统计分析计算机发布继续运行下一步单步仿真命令到环境主控系统计算机,环境主控系统计算机接收到下一步单步仿真运行命令信号后,返回步骤三。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号