基于策略增益均衡的异构无人机协同决策方法

费思邈; 霍琳; 李诗琪

首页> 中文期刊>兵器装备工程学报 >基于策略增益均衡的异构无人机协同决策方法

基于策略增益均衡的异构无人机协同决策方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

采用多智能体强化学习方法训练多个异构无人机智能协同执行复杂任务时,通常因为每个无人机的策略改变而影响其他无人机的训练进程,导致训练结果的震荡甚至无法收敛。针对这一问题,以多个攻击型无人机和干扰型无人机组成混合编队,通过封锁区并攻击有价值目标的复杂协同任务为背景,提出了一种新的群体策略水平增益均衡方法,结合多智能体独立强化学习训练技术,通过最大化每个无人机自身的奖赏,而不是优化整个集群的最大化奖赏来训练2种异构智能体协同合作,实现异构智能体稳定的探索和策略优化。最后通过仿真实验证明了该方法的有效性和优越性。

著录项

来源
《兵器装备工程学报》|2021年第11期|P.174-180|共7页
作者
费思邈; 霍琳; 李诗琪;
展开▼
作者单位

沈阳飞机设计研究所沈阳110035;

沈阳航空航天大学沈阳110135;

沈阳航空航天大学沈阳110135;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动推理、机器学习;
关键词
异构无人机; 强化学习; 协同决策; 策略增益均衡; PPO;
入库时间 2023-07-25 17:48:45

相似文献

中文文献
外文文献
专利

1. 基于狼群算法的多无人机协同多目标攻防满意决策方法 [J] . 周同乐 ,陈谋 ,朱荣刚 . 指挥与控制学报 . 2020,第003期
2. 基于狼群算法的多无人机协同多目标攻防满意决策方法 [J] . 周同乐 ,陈谋 ,朱荣刚 . 指挥与控制学报 . 2020,第003期
3. 基于改进合同网的异构无人机协同对地任务分配 [J] . 廖承城 ,陶伟 ,刘韬 . 现代计算机（专业版） . 2021,第015期
4. 基于云雾边异构协同的无人机智慧巡检系统 [J] . 黄郑 ,王永强 ,王红星 . 中国电力 . 2020,第004期
5. 异构多无人机协同算法仿真平台设计与实现 [C] . XU Yuguo ,徐玉国 ,LIU Peizhi . 第十四届全国信号和智能信息处理与应用学术会议 . 2021
6. 基于stackelberg均衡的运动目标多无人机协同搜索方法研究 [A] . 王瑞安 . 2019

基于策略增益均衡的异构无人机协同决策方法

摘要

著录项

相似文献

相关主题

期刊订阅