首页> 外文期刊>Mathematical Methods of Operations Research >Non-randomized policies for constrained Markov decision processes
【24h】

Non-randomized policies for constrained Markov decision processes

机译:约束马尔可夫决策过程的非随机策略

获取原文
获取原文并翻译 | 示例
           

摘要

This paper addresses constrained Markov decision processes, with expected discounted total cost criteria, which are controlled by non-randomized policies. A dynamic programming approach is used to construct optimal policies. The convergence of the series of finite horizon value functions to the infinite horizon value function is also shown. A simple example illustrating an application is presented.
机译:本文讨论了受约束的马尔可夫决策过程,该过程具有预期的折现总成本标准,该标准受非随机策略控制。动态规划方法用于构造最佳策略。还显示了一系列有限水平值函数向无限水平值函数的收敛性。给出了说明应用程序的简单示例。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号