...
首页> 外文期刊>Automatica >Continuous-time Markov decision processes with nth-bias optimality criteria
【24h】

Continuous-time Markov decision processes with nth-bias optimality criteria

机译:具有n个偏差最优准则的连续时间Markov决策过程

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

In this paper, we study the nth-bias optimality problem for finite continuous-time Markov decision processes (MDPs) with a multichain structure. We first provide nth-bias difference formulas for two policies and present some interesting characterizations of an nth-bias optimal policy by using these difference formulas. Then, we prove the existence of an nth-bias optimal policy by using nth-bias optimal policy iteration algorithms, and show that such an nth-bias optimal policy can be obtained in a finite number of policy iterations.
机译:在本文中,我们研究了具有多链结构的有限连续时间马尔可夫决策过程(MDP)的n次偏置最优性问题。我们首先提供两种策略的n偏差差分公式,并使用这些差异公式给出n偏差最优策略的一些有趣特征。然后,我们通过使用nth-bias最优策略迭代算法证明了nth-bias最优策略的存在,并表明可以通过有限数量的策略迭代获得这种nth-bias最优策略。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号