首页> 外文期刊>Neural computation >A Unified Analysis of Value-Function-Based Reinforcement- Learning Algorithms
【24h】

A Unified Analysis of Value-Function-Based Reinforcement- Learning Algorithms

机译:基于价值函数的强化学习算法的统一分析

获取原文
获取原文并翻译 | 示例
       

摘要

Reinforcement learning is the problem of generating optimal behavior in a sequential decision-making environment given the opportunity of interacting with it. Many algorithms for solving reinforcement-learning problems work by computing improved estimates of the optimal value function. We extend prior analyses of reinforcement-learning algorithms and present a powerful new theorem that can provide a unified analysis of such value-function-based reinforcement-learning algorithms.
机译:强化学习是在有机会与之互动的情况下,在顺序决策环境中生成最佳行为的问题。许多用于解决强化学习问题的算法都是通过计算最佳值函数的改进估计来起作用的。我们扩展了强化学习算法的先前分析,并提出了一个功能强大的新定理,该定理可以为此类基于价值函数的强化学习算法提供统一的分析。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号