...
首页> 外文期刊>Acta Informatica >Finite optimal control for time-bounded reachability in CTMDPs and continuous-time Markov games
【24h】

Finite optimal control for time-bounded reachability in CTMDPs and continuous-time Markov games

机译:CTMDP和连续时间Markov游戏中有限可达性的有限最优控制

获取原文
获取原文并翻译 | 示例
           

摘要

We establish the existence of optimal scheduling strategies for time-bounded reachability in continuous-time Markov decision processes, and of co-optimal strategies for continuous-time Markov games. Furthermore, we show that optimal control does not only exist, but has a surprisingly simple structure: the optimal schedulers from our proofs are deterministic and timed positional, and the bounded time can be divided into a finite number of intervals, in which the optimal strategies are positional. That is, we demonstrate the existence of finite optimal control. Finally, we show that these pleasant properties of Markov decision processes extend to the more general class of continuous-time Markov games, and that both early and late schedulers show this behaviour.
机译:我们建立了连续时间马尔可夫决策过程中有时间限制的可到达性的最优调度策略,以及连续时间马尔可夫博弈的最优策略的存在。此外,我们证明了最优控制不仅存在,而且具有令人惊讶的简单结构:根据我们的证明,最优调度程序是确定性的和定时的位置,并且有界时间可以划分为有限数量的间隔,其中最优策略是位置。也就是说,我们证明了有限最优控制的存在。最后,我们证明了马尔可夫决策过程的这些令人愉悦的特性扩展到了更通用的连续时间马尔可夫博弈类,并且早期和晚期调度程序都显示了这种行为。

著录项

  • 来源
    《Acta Informatica》 |2011年第6期|p.291-315|共25页
  • 作者

    Markus N. Rabe; Sven Schewe;

  • 作者单位

    Universitat des Saarlandes, Saarbriicken, Germany;

    University of Liverpool, Liverpool, UK;

  • 收录信息 美国《科学引文索引》(SCI);
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号