首页> 外文期刊>Systems and Control Letters >A note on the convergence rate of the value iteration scheme in controlled Markov chains
【24h】

A note on the convergence rate of the value iteration scheme in controlled Markov chains

机译:关于受控马尔可夫链中值迭代方案收敛速度的一点说明

获取原文
获取原文并翻译 | 示例
           

摘要

This work is concerned with controlled Markov chains with bounded costs. Assuming that the transition probabilities satisfy a simultaneous Doeblin condition, it is shown that Schweitzer's transformation on the transition law yields a strong ergodicity condition that implies that the solution to the average cost optimality equation can be approximated, at a geometric rate, via the value iteration scheme. (C) 1998 Elsevier Science B.V. All rights reserved. [References: 16]
机译:这项工作涉及具有有限成本的受控马尔可夫链。假设转移概率满足同时的Doeblin条件,则表明对转移定律的Schweitzer变换产生了很强的遍历性条件,这意味着可以通过值迭代以几何速率近似平均成本最优方程的解。方案。 (C)1998 Elsevier Science B.V.保留所有权利。 [参考:16]

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号