Optimal decisions for continuous time Markov decision processes overn   finite planning horizons

Buchholz Peter; Dohndorf Iryna; Scheftelowitsch Dimitri

首页> 外文期刊>Computers & operations research >Optimal decisions for continuous time Markov decision processes overn finite planning horizons

【24h】

Optimal decisions for continuous time Markov decision processes overn finite planning horizons

机译：有限规划范围内连续时间马尔可夫决策过程的最优决策

获取原文

获取原文并翻译 | 示例

开具论文收录证明 >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

The computation of epsilon-optimal policies for continuous time Markov decision processes (CTMDPs) over finite time intervals is a sophisticated problem because the optimal policy may change at arbitrary times. Numerical algorithms based on time discretization or uniformization have been proposed for the computation of optimal policies. The uniformization based algorithm has shown to be more reliable and often also more efficient but is currently only available for processes where the gain or re

机译：对于有限时间间隔内的连续时间马尔可夫决策过程（CTMDP），ε最优策略的计算是一个复杂的问题，因为最优策略可能会在任意时间发生变化。提出了基于时间离散化或均匀化的数值算法来计算最优策略。基于均匀化的算法已显示出更可靠且通常也更有效，但目前仅适用于增益或增益

著录项

来源
《Computers & operations research》 |2017年第1期|267-278|共12页
作者
Buchholz Peter; Dohndorf Iryna; Scheftelowitsch Dimitri;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种 eng
中图分类
关键词
Continuous time Markov decision process; Finite horizon; Uniformization; Numerical techniques; Optimization;

机译：连续时间马尔可夫决策过程;有限视野;均匀性;数值技术;优化;

相似文献

外文文献
中文文献
专利

1. FINITE-HORIZON OPTIMALITY FOR CONTINUOUS-TIME MARKOV DECISION PROCESSES WITH UNBOUNDED TRANSITION RATES [J] . Guo Xianping, Huang Xiangxiang, Huang Yonghui Advances in applied probability . 2015,第4期

机译：具有无界转换率的连续时间马尔可夫决策过程的有限水平最优性
2. STRONG N-DISCOUNT AND FINITE-HORIZON OPTIMALITY FOR CONTINUOUS-TIME MARKOV DECISION PROCESSES [J] . ZHU Quanxin, GUO Xianping 系统科学与复杂性：英文版 . 2014,第005期

机译：连续马尔可夫决策过程的强N折扣和有限水平最优性
3. Numerical analysis of continuous time Markov decision processes over finite horizons [J] . Peter Buchholz, Ingo Schulz Computers & operations research . 2011,第3期

机译：有限时间范围内连续时间马尔可夫决策过程的数值分析
4. Optimal control of average reward constrained continuous-time finite Markov decision processes [C] . Feinberg, E.A. . 2002

机译：平均奖励约束连续时间有限马尔可夫决策过程的最优控制
5. Finite memory policies for partially observable Markov decision processes. [D] . Lusena, Christopher David. 2001

机译：用于部分可观察的马尔可夫决策过程的有限内存策略。
6. Planning ahead in public health? A qualitative study of the time horizons used in public health decision-making [O] . David C Taylor-Robinson, Beth Milton, Ffion Lloyd-Williams, 2008

机译：提前规划公共卫生？定性研究公共卫生决策中使用的时间范围
7. Finite state continuous time Markov decision processes with an infinite planning horizon [O] . Miller Bruce L 1968

机译：无限规划视野的有限状态连续时间马尔可夫决策过程

Optimal decisions for continuous time Markov decision processes overn finite planning horizons

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅