基于近端策略优化的作战实体博弈对抗算法

张振; 黄炎焱; 张永亮; 陈天德

首页> 中文期刊> 《南京理工大学学报：自然科学版》 >基于近端策略优化的作战实体博弈对抗算法

基于近端策略优化的作战实体博弈对抗算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对一种大地图和稀疏奖励的兵棋推演对抗环境下,单纯的深度强化学习算法会导致训练无法快速收敛以及智能体对抗特定规则智能体胜率较低的问题,提出了一种基于监督学习和深度强化学习相结合以及设置额外奖励的方法,旨在提升智能博弈的训练效果。使用监督学习训练智能体;研究基于近端策略优化(Proximal policy optimization,PPO)的对抗算法;改进强化学习训练过程的额外奖励设置。以某在研兵棋推演环境为例的实验结果表明,该博弈对抗算法能使智能体在对抗其他智能体时的胜率稳步提升并在较短时间内达到收敛。

著录项

来源
《南京理工大学学报：自然科学版》 |2021年第1期|77-83|共7页
作者
张振; 黄炎焱; 张永亮; 陈天德;
展开▼
作者单位

南京理工大学自动化学院;

江苏南京210094;

陆军工程大学指挥控制工程学院;

江苏南京210007;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动推理、机器学习;军事技术基础科学;
关键词
兵棋推演; 深度强化学习; 监督学习; 近端策略优化; 稀疏奖励;

相似文献

中文文献
外文文献
专利

1. 基于近端策略优化与对抗学习的对话生成 [J] . 蔡钺 ,游进国 ,丁家满 . 计算机工程与科学 . 2020,第009期
2. 作战推演中智能博弈对抗算法水平评估模型研究 [J] . 韩超 . 舰船电子工程 . 2020,第009期
3. 基于HLA的分布式作战实体对抗视景仿真 [J] . 王怀晓 ,刘建永 ,陆莺 . 计算机应用 . 2011,第A01期
4. 基于HLA的分布式作战实体对抗视景仿真 [J] . 王怀晓 ,刘建永 ,陆莺 . 计算机应用 . 2011,第0z1期
5. 基于协同对抗的水下博弈策略优化 [J] . 魏娜 ,刘明雍 ,张帅 . 西北工业大学学报 . 2019,第001期
6. 基于作战效能的对抗性时敏目标打击策略优化 [C] . GENG Tao ,耿涛 ,Zou Shi-xi . 第三届中国指挥控制大会 . 2015
7. 基于博弈机制和混合策略的多目标粒子群算法优化研究 [A] . 王伟 . 2020

基于近端策略优化的作战实体博弈对抗算法

摘要

著录项

相似文献

相关主题

期刊订阅