首页> 中文期刊>兵器装备工程学报 >基于策略增益均衡的异构无人机协同决策方法

基于策略增益均衡的异构无人机协同决策方法

     

摘要

采用多智能体强化学习方法训练多个异构无人机智能协同执行复杂任务时,通常因为每个无人机的策略改变而影响其他无人机的训练进程,导致训练结果的震荡甚至无法收敛。针对这一问题,以多个攻击型无人机和干扰型无人机组成混合编队,通过封锁区并攻击有价值目标的复杂协同任务为背景,提出了一种新的群体策略水平增益均衡方法,结合多智能体独立强化学习训练技术,通过最大化每个无人机自身的奖赏,而不是优化整个集群的最大化奖赏来训练2种异构智能体协同合作,实现异构智能体稳定的探索和策略优化。最后通过仿真实验证明了该方法的有效性和优越性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号