Continuous-time Markov decision processes with nth-bias optimality criteria

Junyu Zhang; Xi-Ren Cao

首页> 外文期刊>Automatica >Continuous-time Markov decision processes with nth-bias optimality criteria

【24h】

Continuous-time Markov decision processes with nth-bias optimality criteria

机译：具有n个偏差最优准则的连续时间Markov决策过程

获取原文

获取原文并翻译 | 示例

获取外文期刊封面封底 >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

In this paper, we study the nth-bias optimality problem for finite continuous-time Markov decision processes (MDPs) with a multichain structure. We first provide nth-bias difference formulas for two policies and present some interesting characterizations of an nth-bias optimal policy by using these difference formulas. Then, we prove the existence of an nth-bias optimal policy by using nth-bias optimal policy iteration algorithms, and show that such an nth-bias optimal policy can be obtained in a finite number of policy iterations.

机译：在本文中，我们研究了具有多链结构的有限连续时间马尔可夫决策过程（MDP）的n次偏置最优性问题。我们首先提供两种策略的n偏差差分公式，并使用这些差异公式给出n偏差最优策略的一些有趣特征。然后，我们通过使用nth-bias最优策略迭代算法证明了nth-bias最优策略的存在，并表明可以通过有限数量的策略迭代获得这种nth-bias最优策略。

著录项

来源
《Automatica》 |2009年第7期|共11页
作者
Junyu Zhang; Xi-Ren Cao;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种 eng
中图分类 TP1TP2;
关键词
Continuous-time systems; Markov decision processes; Multichain model; Nth-bias optimality criteria; Policy iteration algorithms; Performance analysis; Sensitivity analysis;

机译：连续时间系统;马尔可夫决策过程;多链模型;N偏最优准则;策略迭代算法;性能分析;灵敏度分析;

相似文献

外文文献
中文文献
专利

1. Continuous-time Markov decision processes with nth-bias optimality criteria [J] . Junyu Zhang, Xi-Ren Cao Automatica . 2009,第7期

机译：具有n个偏差最优准则的连续时间Markov决策过程
2. Optimality of Mixed Policies for Average Continuous-Time Markov Decision Processes with Constraints [J] . Guo Xianping, Zhang Yi Mathematics of operations research . 2016,第4期

机译：约束条件下平均连续时间马尔可夫决策过程混合策略的最优性
3. Verifiable conditions for average optimality of continuous-time Markov decision processes [J] . Zou Xiaolong, Huang Yonghui Operations Research Letters: A Journal of the Operations Research Society of America . 2016,第6期

机译：连续时间马尔可夫决策过程的平均最优性的可验证条件
4. Discounted Optimality for Continuous-Time Markov Decision Processes in Polish Spaces [C] . Xianping Guo . 2006

机译：波兰空间中连续时间马尔可夫决策过程的折扣最优性
5. Markov Decision Processes and Approximate Dynamic Programming Methods for Optimal Treatment Design [D] . Mason, Jennifer Elizabeth 2012

机译：马尔可夫决策过程和近似动态规划方法进行最优处理设计
6. Using model-based proposals for fast parameter inference on discrete state space continuous-time Markov processes [O] . C. M. Pooley, S. C. Bishop, G. Marion 2015

机译：使用基于模型的建议对离散状态空间连续时间马尔可夫过程进行快速参数推断
7. Optimality of Mixed Policies for Average Continuous-Time Markov Decision Processes with Constraints [O] . Guo X, Zhang Y 2016

机译：约束条件下平均连续时间马尔可夫决策过程混合策略的最优性
8. On the Risk-Sensitive Optimality Criteria for Markov Decision Processes. [R] . sladky, karel 1975

机译：马尔可夫决策过程的风险敏感最优性准则。

Continuous-time Markov decision processes with nth-bias optimality criteria

摘要

著录项

相似文献

相关主题

期刊订阅