Multiconstrained Finite-Horizon Piecewise Deterministic Markov Decision Processes with Unbounded Transition Rates

首页> 外文期刊>Mathematics of operations research >Multiconstrained Finite-Horizon Piecewise Deterministic Markov Decision Processes with Unbounded Transition Rates

【24h】

Multiconstrained Finite-Horizon Piecewise Deterministic Markov Decision Processes with Unbounded Transition Rates

机译：多元素有限地平线分段确定型马尔可夫决策过程，具有无限的过渡率

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

This paper studies a multiconstrained problem for piecewise deterministic Markov decision processes (PDMDPs) with unbounded cost and transition rates. The goal is to minimize one type of expected finite-horizon cost over history-dependent policies while keeping some other types of expected finite-horizon costs lower than some tolerable bounds. Using the Dynkin formula for the PDMDPs, we obtain an equivalent characterization of occupancy measures and express the expected finite-horizon costs in terms of occupancy measures. Under suitable assumptions, the existence of constrained-optimal policies is shown, the linear programming formulation and its dual program for the constrained problem are derived, and the strong duality between the two programs is established. An example is provided to demonstrate our results.

机译：本文研究了具有无限成本和转换率的分段确定性马尔可夫决策过程（PDMDP）的多元统一问题。目标是最大限度地减少一种类型的预期有限范围成本，而不是历史依赖性政策，同时保持其他一些类型的预期有限范围成本低于某种可容忍的范围。使用PDMDP的Dynkin公式，我们获得了占用率的等效表征，并在入住措施方面表达了预期的有限范围成本。在合适的假设下，示出了受约束的最佳策略的存在，导出了线性编程配方及其用于约束问题的双程程序，并且建立了两个程序之间的强不良性。提供了一个例子来展示我们的结果。

著录项

来源
《Mathematics of operations research》 |2020年第2期|共19页
作者

展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种 eng
中图分类运筹学;
关键词
piecewise deterministic Markov decision process; finite horizon; constrained problem; occupancy measure; linear program;

机译：分段确定性马尔可夫决策过程;有限地平线;受限制的问题;占用措施;线性计划;

相似文献

外文文献
中文文献
专利

1. Multiconstrained Finite-Horizon Piecewise Deterministic Markov Decision Processes with Unbounded Transition Rates [J] . Mathematics of operations research . 2020,第2期

机译：多元素有限地平线分段确定型马尔可夫决策过程，具有无限的过渡率
2. FINITE-HORIZON OPTIMALITY FOR CONTINUOUS-TIME MARKOV DECISION PROCESSES WITH UNBOUNDED TRANSITION RATES [J] . Guo Xianping, Huang Xiangxiang, Huang Yonghui Advances in applied probability . 2015,第4期

机译：具有无界转换率的连续时间马尔可夫决策过程的有限水平最优性
3. Risk-sensitive finite-horizon piecewise deterministic Markov decision processes [J] . Huang Yonghui, Lian Zhaotong, Guo Xianping Operations Research Letters: A Journal of the Operations Research Society of America . 2020,第1期

机译：风险敏感的有限地平线分段确定型马尔可夫决策过程
4. Markov Decision Problems with Unbounded Transition Rates under Discounted-Cost Performance Criteria [C] . Baoqun Yin, Yanjie Li, Guiping Dai, Fifth World Congress on Intelligent Control and Automation(WCICA 2004) vol.1 . 2004

机译：贴现成本绩效标准下无限制转移率的马尔可夫决策问题
5. A hybrid genetic/optimization algorithm for piecewise affine and convex Markov decision processes. [D] . Lin, Zong-Zhi. 1999

机译：分段仿射和凸马尔可夫决策过程的混合遗传/优化算法。
6. Efficient analysis of stochastic gene dynamics in the non-adiabatic regime using piecewise deterministic Markov processes [O] . Yen Ting Lin, Nicolas E. Buchler 2018

机译：使用分段确定性马尔可夫过程对非绝热状态下的随机基因动力学进行有效分析
7. A new characterization of the jump rate for piecewise-deterministic Markov processes with discrete transitions [O] . Azaïs, Romain, Genadot, Alexandre 2017

机译：具有离散转移的分段确定性马尔可夫过程的跳跃率的新表征
8. Shift-Function Approach for Markov Decision Processes with Unbounded Returns [R] . Stidham, S. , Van Nunen, J. 1981

机译：具有无界收益的马尔可夫决策过程的移位函数方法

Multiconstrained Finite-Horizon Piecewise Deterministic Markov Decision Processes with Unbounded Transition Rates

摘要

著录项

相似文献

相关主题

期刊订阅