首页> 外文期刊>Mathematical methods of operations research >Hierarchical algorithms for discounted and weighted Markov decision processes
【24h】

Hierarchical algorithms for discounted and weighted Markov decision processes

机译:折现和加权马尔可夫决策过程的层次算法

获取原文
获取原文并翻译 | 示例
           

摘要

We consider a discrete time finite Markov decision process (MDP) with the discounted and weighted reward optimality criteria. In [1] the authors considered some decomposition of limiting average MDPs. In this paper, we use an analogous approach for discounted and weighted MDPs. Then, we construct some hierarchical decomposition algorithms for both discounted and weighted MDPs.
机译:我们考虑具有折扣和加权奖励最优标准的离散时间有限马尔可夫决策过程(MDP)。在[1]中,作者考虑了极限平均MDP的一些分解。在本文中,我们对折现和加权MDP使用类似的方法。然后,我们为折价和加权MDP构造了一些层次分解算法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号