首页> 外国专利> Efficient Off-Policy Credit Assignment

Efficient Off-Policy Credit Assignment

机译:高效的非政策信用分配

摘要

Systems and methods are provided for efficient off-policy credit assignment (ECA) in reinforcement learning. ECA allows principled credit assignment for off-policy samples, and therefore improves sample efficiency and asymptotic performance. One aspect of ECA is to formulate the optimization of expected return as approximate inference, where policy is approximating a learned prior distribution, which leads to a principled way of utilizing off-policy samples. Other features are also provided.
机译:提供了用于强化学习中有效的政策外信用分配(ECA)的系统和方法。 ECA允许对非政策性样本进行有原则的信用分配,因此可以提高样本效率和渐近性能。 ECA的一个方面是将预期收益的优化公式化为近似推断,其中政策近似于学习的先验分布,这导致了利用非政策样本的原则方法。还提供其他功能。

著录项

  • 公开/公告号US2020285993A1

    专利类型

  • 公开/公告日2020-09-10

    原文格式PDF

  • 申请/专利权人 SALESFORCE.COM INC.;

    申请/专利号US201916653890

  • 发明设计人 HAO LIU;RICHARD SOCHER;CAIMING XIONG;

    申请日2019-10-15

  • 分类号G06N20;G06N5/02;

  • 国家 US

  • 入库时间 2022-08-21 11:20:12

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号