Robust Optimality for Discounted Infinite-Horizon Markov Decision Processes With Uncertain Transition Matrices

Baohua Li; Si J.

首页> 外文期刊>IEEE Transactions on Automatic Control >Robust Optimality for Discounted Infinite-Horizon Markov Decision Processes With Uncertain Transition Matrices

【24h】

Robust Optimality for Discounted Infinite-Horizon Markov Decision Processes With Uncertain Transition Matrices

机译：不确定转移矩阵的无穷折扣马尔可夫决策过程的鲁棒最优性

获取原文

获取原文并翻译 | 示例

开具论文收录证明 >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

We study finite-state, finite-action, discounted infinite-horizon Markov decision processes with uncertain transition matrices in the deterministic policy space. The transition matrices are classified as either independent or correlated. A generalized robust optimality criterion which can be degenerated to some popular optimality criteria is proposed, under which an optimal or near-optimal policy exists for any uncertain transition matrix. Theorems are developed to guarantee a stationary policy being optimal or near-optimal in the deterministic policy space.

机译：我们研究了在确定性政策空间中具有不确定转移矩阵的有限状态，有限作用，折现无限水平马尔可夫决策过程。过渡矩阵分为独立的或相关的。提出了可以退化为一些流行的最优准则的广义鲁棒最优准则，在该准则下，对于任何不确定的转移矩阵，存在最优或接近最优的策略。建立定理以确保固定策略在确定性策略空间中是最佳或接近最优的。

著录项

来源
《IEEE Transactions on Automatic Control》 |2008年第9期|p.2112-2116|共5页
作者
Baohua Li; Si J.;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种 eng
中图分类自动化系统;
关键词
Markov processes; decision theory; infinite horizon; matrix algebra; uncertain systems; deterministic policy space; discounted infinite-horizon Markov decision process; finite-state finite-action MDP; generalized robust optimality criterion; uncertain transition;

机译：马尔可夫过程;决策理论;无限视野;矩阵代数;不确定系统;确定性策略空间;打折的无限水平马尔可夫决策过程;有限状态有限作用MDP;广义鲁棒最优准则;不确定过渡;

相似文献

外文文献
中文文献
专利

1. Approximate Robust Policy Iteration Using Multilayer Perceptron Neural Networks for Discounted Infinite-Horizon Markov Decision Processes With Uncertain Correlated Transition Matrices [J] . Li B., Si J. Neural Networks, IEEE Transactions on . 2010,第8期

机译：不确定关联Markov决策过程的多层感知器神经网络的近似鲁棒策略迭代
2. Robust control of Markov decision processes with uncertain transition matrices [J] . Nilim A, El Ghaoui L Operations Research: The Journal of the Operations Research Society of America . 2005,第5期

机译：具有不确定转移矩阵的Markov决策过程的鲁棒控制
3. MONOTONE OPTIMAL POLICIES IN DISCOUNTED MARKOV DECISION PROCESSES WITH TRANSITION PROBABILITIES INDEPENDENT OF THE CURRENT STATE: EXISTENCE AND APPROXIMATION [J] . Rosa M. Flores-Hernandez Kybernetika . 2013,第5期

机译：具有独立于电流状态的转移概率的马尔可夫折扣决策过程中的单调最优策略：存在性和近似性
4. Robust Dynamic Programming for Discounted Infinite-Horizon Markov Decision Processes with Uncertain Stationary Transition Matrice [C] . Baohua Li, Si, J. . 2007

机译：不确定平稳转移矩阵的无穷折扣马尔可夫决策过程的鲁棒动态规划
5. Increasing scalability in algorithms for centralized and decentralized partially observable Markov decision processes: Efficient decision-making and coordination in uncertain environments. [D] . Amato, Christopher. 2010

机译：用于集中式和分散式部分可观察的马尔可夫决策过程的算法中的可伸缩性不断增强：在不确定的环境中进行有效的决策和协调。
6. Evolving Robust Policy Coverage Sets in Multi-Objective Markov Decision Processes Through Intrinsically Motivated Self-Play [O] . Sherif Abdelfattah, Kathryn Kasmarik, Jiankun Hu 2018

机译：通过内在动机的自我博弈在多目标马尔可夫决策过程中发展稳健的政策覆盖范围
7. Robust control of Markov decision processes with uncertain transition matrices [O] . Arnab Nilim, Laurent El Ghaoui 2005

机译：具有不确定转移矩阵的Markov决策过程的鲁棒控制

Robust Optimality for Discounted Infinite-Horizon Markov Decision Processes With Uncertain Transition Matrices

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅