基于多组并行深度Q网络的连续空间追逃博弈算法

刘冰雁; 叶雄兵; 岳智宏; 董献洲; 张其扬

首页> 中文期刊>兵工学报 >基于多组并行深度Q网络的连续空间追逃博弈算法

基于多组并行深度Q网络的连续空间追逃博弈算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

为解决连续空间追逃博弈(PEG)问题,提出一种基于多组并行深度Q网络(DQN)的连续空间PEG算法.应对连续行为空间中为避免传统强化学习存在的维数灾难不足,通过构建Tak-agi-Sugeno-Kang模糊推理模型来表征连续空间;为应对离散动作集自学习复杂且耗时不足,设计基于多组并行DQN的PEG算法.以4轮战车PEG问题为例设计仿真环境与运动模型,进行了运动计算,并与Q-learning算法、基于资格迹的强化学习算法、基于奖励的遗传算法结果相比对.仿真实验结果表明,连续空间PEG算法能够较好地解决连续空间PEG问题,且随着学习次数的增加不断提升问题处理能力,具备自主学习耗时少、追捕应用时间短的比较优势.

著录项

来源
《兵工学报》|2021年第3期|663-672|共10页
作者
刘冰雁; 叶雄兵; 岳智宏; 董献洲; 张其扬;
展开▼
作者单位

军事科学院北京100091;

32032部队北京100094;

军事科学院北京100091;

32032部队北京100094;

军事科学院北京100091;

32032部队北京100094;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动推理、机器学习;
关键词
追逃博弈; 连续空间; 深度Q网络; 神经网络; 微分对策; 智能战车;

相似文献

中文文献
外文文献
专利

1. 基于神经网络的实时滚动追逃博弈导弹制导律 [J] . Z H U Qiang ,S HAO Zhijiang . 系统工程与电子技术 . 2019,第007期
2. 基于大数据的并行化深度卷积神经网络优化算法 [J] . 毛伊敏 ,张瑞朋 ,曹文梁 . 计算机应用研究 . 2021,第005期
3. 基于深度神经网络与MPI并行计算的人脸识别算法研究 [J] . 柏涛涛 . 西安文理学院学报（自然科学版） . 2020,第002期
4. 基于深度网络的多人计算机博弈算法研究 [J] . 柴化云 ,王福成 . 信息技术与信息化 . 2020,第012期
5. 基于粒子群算法与连续型深度信念网络的水泥熟料游离氧化钙预测 [J] . 刘彬 ,赵朋程 ,高伟 . 计量学报 . 2018,第003期
6. 基于活跃区域的多机器人分层追逃算法 [C] . 方宝富 ,潘启树 ,洪炳镕 . 第九届中国智能机器人学术研讨会 . 2011
7. 基于微分博弈论的多无人机追逃协同机动技术研究 [A] . 谢剑 . 2015

基于多组并行深度Q网络的连续空间追逃博弈算法

摘要

著录项

相似文献

相关主题

期刊订阅