【24h】

Policy Iteration for Average Cost Markov Control Processes on Borel Spaces

机译:Borel空间上平均成本马尔可夫控制过程的策略迭代

获取原文
获取原文并翻译 | 示例
       

摘要

This paper studies the policy iteration algorithm (PIA) for average cost Markov control processes on Borel spaces. Two classes of MCPs are considered. One of them allows some restricted-growth unbounded cost functions and compact control constraint sets; the other one requires strictly unbounded costs and the control constraint sets may be non-compact. For each of these classes, the PIA yields, under suitable assumptions, the optimal (minimum) cost, an optimal stationary control policy, and a solution to the average cost optimality equation.
机译:本文研究了Borel空间上平均成本Markov控制过程的策略迭代算法(PIA)。考虑了两类MCP。其中之一允许一些限制增长的无穷成本函数和紧凑的控制约束集;另一种则要求严格的无限制成本,并且控制约束集可能不紧凑。对于这些类别中的每一个类别,PIA都会在适当的假设下产生最佳(最小)成本,最佳固定控制策略以及平均成本最优方程的解。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号