首页> 中国专利> 无人机对抗策略优化方法及装置

无人机对抗策略优化方法及装置

摘要

本发明提供一种无人机对抗策略优化方法及装置,所述方法包括:根据策略网络参数生成对抗策略,利用PPO算法根据对抗策略生成动作序列;无人机在当前状态根据动作序列执行动作并与环境交互,得到下一状态和综合奖励值;使用梯度上升法更新策略网络参数,使用梯度下降法更新值网络参数;重复执行上述过程,直至达到训练结束时机。本发明提供的无人机对抗策略优化方法及装置,通过基于策略网络参数生成无人机对抗策略,并利用梯度上升法更新策略网络参数,同时借助无人机与环境交互得到的奖励值对无人机对抗策略的优劣作出反馈,基于此实现了无人机基于环境信息进行实时的对抗策略的优化更新,提高了无人机在对抗过程中的自主决策能力。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-01-21

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号