首页> 外文期刊>IEEE Transactions on Automatic Control >A Policy Improvement Method in Constrained Stochastic Dynamic Programming
【24h】

A Policy Improvement Method in Constrained Stochastic Dynamic Programming

机译:约束随机动态规划中的一种策略改进方法

获取原文
获取原文并翻译 | 示例

摘要

This note presents a formal method of improving a given base-policy such that the performance of the resulting policy is no worse than that of the base-policy at all states in constrained stochastic dynamic programming. We consider finite horizon and discounted infinite horizon cases. The improvement method induces a policy iteration-type algorithm that converges to a local optimal policy.
机译:本说明介绍了一种改进给定基本策略的正式方法,以使在受限的随机动态规划中,所得策略的性能不比所有州的基本策略的性能差。我们考虑有限范围和折现无限范围的情况。该改进方法产生了收敛于局部最优策略的策略迭代型算法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号