首页> 中国专利> 一种基于深度强化学习的作战策略优化方法及系统

一种基于深度强化学习的作战策略优化方法及系统

摘要

本发明公开了一种基于深度强化学习的作战策略优化方法及系统,该方法包括:构建高超声速滑翔弹模型,确定导弹的当前状态;构建神经网络模型,神经网络模型的输入为突防环境,输出为动作集;根据突防环境,基于神经网络模型,得到预测动作集;根据当前状态以及预测动作集,计算导弹的下一步状态并更新高超声速滑翔弹模型;采用Minimax算法计算敌方状态;根据下一步状态以及敌方状态计算奖惩函数;根据奖惩函数优化神经网络模型;基于优化后的神经网络模型得到最优作战策略。本发明具有短距离精确操作和长期规划预测的能力,推演效果符合预期,同时其具有较强的实时决策能力,可以很大程度的提高突防成功的概率,可作为滑翔弹突防的决策依据。

著录项

  • 公开/公告号CN113050686A

    专利类型发明专利

  • 公开/公告日2021-06-29

    原文格式PDF

  • 申请/专利权人 北京航空航天大学;

    申请/专利号CN202110294246.4

  • 申请日2021-03-19

  • 分类号G05D1/10(20060101);

  • 代理机构11569 北京高沃律师事务所;

  • 代理人王爱涛

  • 地址 100191 北京市海淀区学院路37号

  • 入库时间 2023-06-19 11:39:06

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-03-25

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号