首页> 中文期刊> 《兵工学报》 >利用强化学习开展比例导引律的导航比设计

利用强化学习开展比例导引律的导航比设计

         

摘要

为提升导弹的制导性能,在比例导引的基础上,分别利用蒙特卡洛强化学习和Q-learning强化学习开展导航比的设计。采用蒙特卡洛强化学习的导航比设计方法,对导弹飞行过程进行粗略分段;利用Q-learning强化学习的导航比设计方法,用飞行时间、视线角速度、预计遭遇时间及目标特性等对制导环境进一步细分,根据环境和状态的变化,自适应地调整比例导引的导航比,以获得最佳的飞行制导策略。基于某型防空导弹,利用上述方法分别开展导航比设计,从全空域弹道库中随机抽取批量弹道进行仿真计算,并与传统经验设计进行对比分析。仿真结果表明,采用强化学习方法设计的导航比能够显著降低边界弹道的脱靶量,说明该设计方法能够切实提升导弹的制导拦截能力。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号