首页> 中国专利> 基于深度强化学习中Actor-Critic框架的策略选择方法

基于深度强化学习中Actor-Critic框架的策略选择方法

摘要

本发明公开了一种基于深度强化学习中Actor‑Critic框架的策略选择方法,该方法通过在Actor中同时保持多个策略,在强化学习训练过程中使用Critic中的动作状态价值函数估计策略的价值期望,根据期望实时地选择或集成其中的优势策略进行输出或更新,其目的在于提升训练速度,并使得在训练中生成有效的局部策略。因此,本发明对于使用Actor‑Critic框架的基于策略梯度的强化学习算法有着提升采样效率,增加参数搜索空间等的技术效果。

著录项

  • 公开/公告号CN111766782B

    专利类型发明专利

  • 公开/公告日2021-07-13

    原文格式PDF

  • 申请/专利权人 浙江大学;

    申请/专利号CN202010600847.9

  • 申请日2020-06-28

  • 分类号G05B13/04(20060101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构33224 杭州天勤知识产权代理有限公司;

  • 代理人王琛

  • 地址 310013 浙江省杭州市西湖区余杭塘路866号

  • 入库时间 2022-08-23 12:07:01

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号