DISCOUNTED CONTINUOUS-TIME MARKOV DECISION PROCESSES WITH UNBOUNDED RATES: THE CONVEX ANALYTIC APPROACH

ALEXEY PIUNOVSKIY; YI ZHANG

首页> 外文期刊>SIAM Journal on Control and Optimization >DISCOUNTED CONTINUOUS-TIME MARKOV DECISION PROCESSES WITH UNBOUNDED RATES: THE CONVEX ANALYTIC APPROACH

【24h】

DISCOUNTED CONTINUOUS-TIME MARKOV DECISION PROCESSES WITH UNBOUNDED RATES: THE CONVEX ANALYTIC APPROACH

机译：利率无限的连续马尔可夫决策过程：凸分析方法

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

This paper deals with constrained discounted continuous-time Markov decision processes, also known as controlled jump Markov processes, with Borel state and action spaces. Under some conditions imposed on the primitives, allowing unbounded transition rates and unbounded from both above and below) cost rates, first, we study the space of occupation measures. Then we reformulate the original problem as a linear program over the space of those measures and undertake the duality analysis. Finally, under some compactness-continuity conditions, we show the existence of a stationary optimal policy out of the class of randomized history-dependent policies.

机译：本文涉及带有Borel状态空间和动作空间的约束折扣连续时间马尔可夫决策过程，也称为受控跳跃马尔可夫过程。在强加于原语的某些条件下，允许无限制的过渡率以及不受成本上下限约束的成本率，首先，我们研究占领措施的空间。然后，我们将原始问题重新设计为在这些度量空间上的线性程序，并进行对偶分析。最后，在某些紧致性-连续性条件下，我们证明了存在随机历史相关策略类别之外的平稳最优策略的存在。

著录项

来源
《SIAM Journal on Control and Optimization》 |2011年第5期|共30页
作者
ALEXEY PIUNOVSKIY; YI ZHANG;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种 eng
中图分类运筹学;
关键词
Borel space; constrained continuous-time Markov decision process; convex analytic approach; duality; history-dependent policies; unbounded rates;

机译：Borel空间;约束连续时间马尔可夫决策过程;凸分析方法;对偶性;历史相关策略;无穷大利率;

相似文献

外文文献
中文文献
专利

1. DISCOUNTED CONTINUOUS-TIME MARKOV DECISION PROCESSES WITH UNBOUNDED RATES: THE CONVEX ANALYTIC APPROACH [J] . ALEXEY PIUNOVSKIY, YI ZHANG SIAM Journal on Control and Optimization . 2011,第5期

机译：利率无限的连续马尔可夫决策过程：凸分析方法
2. RISK-SENSITIVE DISCOUNTED CONTINUOUS-TIME MARKOV DECISION PROCESSES WITH UNBOUNDED RATES [J] . Guo Xianping, Liao Zhong-Wei SIAM Journal on Control and Optimization . 2019,第6期

机译：风险敏感折扣连续时间马尔可夫决策流程，具有无限性率
3. Discounted continuous-time markov decision processes with constraints: Unbounded transition and loss rates [J] . Guo X., Piunovskiy A. Mathematics of operations research . 2011,第1期

机译：具有约束条件的折扣连续时间马尔科夫决策过程：无限制的过渡和损失率
4. DISCOUNTED CONTINUOUS TIME MARKOV DECISION PROCESSES: THE CONVEX ANALYTIC APPROACH [C] . A.B. Piunovskiy IFAC (International Federation of Automatic Control) World Congress . 2005

机译：打折连续时间马尔可夫决策过程：凸分析方法
5. A hybrid genetic/optimization algorithm for piecewise affine and convex Markov decision processes. [D] . Lin, Zong-Zhi. 1999

机译：分段仿射和凸马尔可夫决策过程的混合遗传/优化算法。
6. Using model-based proposals for fast parameter inference on discrete state space continuous-time Markov processes [O] . C. M. Pooley, S. C. Bishop, G. Marion 2015

机译：使用基于模型的建议对离散状态空间连续时间马尔可夫过程进行快速参数推断
7. Discounted Continuous-time Markov Decision Processes with Unbounded Rates: the Dynamic Programming Approach [O] . Piunovskiy, Alexey, Zhang, Yi 2011

机译：具有无界的折扣连续时间马尔可夫决策过程费率：动态规划方法
8. Countable State Discounted Markovian Decision Processes with Unbounded Rewards [R] . Harrison, J. M. 1970

机译：具有无限奖励的可数州折现马尔可夫决策过程

DISCOUNTED CONTINUOUS-TIME MARKOV DECISION PROCESSES WITH UNBOUNDED RATES: THE CONVEX ANALYTIC APPROACH

摘要

著录项

相似文献

相关主题

期刊订阅