首页> 中文期刊>指挥信息系统与技术 >基于深度强化学习的弹道导弹中段突防控制

基于深度强化学习的弹道导弹中段突防控制

     

摘要

提出了一种基于Markov决策过程的弹道导弹中段突防控制模型,并基于状态?动作对值函数建立了一种完全数据驱动的控制模型.为了加快深度神经网络的收敛速度、增强训练过程中的稳定性,引入了竞争架构和目标网络架构,设计了一种深度神经网络架构竞争双深度Q网络(D3Q).对传统深度Q网络(DQN)的强化学习算法中的记忆池生成方法进行了改进,提升了训练样本质量.训练及验证结果表明,该方法实现了D3Q网络对弹道导弹中段突防最优控制模型的逼近.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号