首页> 外文期刊>Mathematical methods of operations research >Accelerated modified policy iteration algorithms for Markov decision processes
【24h】

Accelerated modified policy iteration algorithms for Markov decision processes

机译:马尔可夫决策过程的加速修改策略迭代算法

获取原文
获取原文并翻译 | 示例
           

摘要

We propose a new approach to accelerate the convergence of the modified policy iteration method for Markov decision processes with the total expected discounted reward. In the new policy iteration an additional operator is applied to the iterate generated by Markov operator, resulting in a bigger improvement in each iteration.
机译:我们提出了一种新方法,以加速总预期折现奖励对Markov决策过程的改进策略迭代方法的收敛。在新的策略迭代中,将一个附加运算符应用于由Markov运算符生成的迭代,从而在每次迭代中都有更大的改进。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号