首页> 中国专利> 一种多智能体深度强化学习方法、系统及应用

一种多智能体深度强化学习方法、系统及应用

摘要

本发明公开了一种基于分区经验与多线程交互的多智能体深度强化学习算法。首先,该算法使用分区缓存区的经验重放形式,通过划分奖励空间来区分正面经验、负面经验与中性经验,并在训练时使用分层随机的采样方式抽取这些经验数据。其次,算法运用多线程的交互方式促进了智能体与环境的试错过程,通过智能体的多个克隆体并行的学习并整合它们的学习经验来训练网络模型的参数。优点是:本发明提出的基于缓存区重放与多线程交互的多智能体深度强化学习算法,结合分区经验缓存区及多线程交互方式的优势,引入到多智能体的深度强化学习算法中;在收敛速度与训练效率上均优于现有的模型,在多智能体环境中具有更高的可用性,可用于解决多智能体的协同追踪目标问题。

著录项

  • 公开/公告号CN112801290B

    专利类型发明专利

  • 公开/公告日2021-11-05

    原文格式PDF

  • 申请/专利权人 中国人民解放军陆军工程大学;

    申请/专利号CN202110216405.9

  • 发明设计人 张婷婷;董会;张赛男;

    申请日2021-02-26

  • 分类号G06N3/08(20060101);

  • 代理机构32224 南京纵横知识产权代理有限公司;

  • 代理人何春廷

  • 地址 210014 江苏省南京市秦淮区后标营路88号

  • 入库时间 2022-08-23 12:44:52

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号