A CONVEX ANALYTIC APPROACH TO RISK-AWARE MARKOV DECISION PROCESSES

Haskell William B.; Jain Rahul

首页> 外文期刊>SIAM Journal on Control and Optimization >A CONVEX ANALYTIC APPROACH TO RISK-AWARE MARKOV DECISION PROCESSES

【24h】

A CONVEX ANALYTIC APPROACH TO RISK-AWARE MARKOV DECISION PROCESSES

机译：风险感知马尔可夫决策过程的凸分析方法

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

In classical Markov decision process (MDP) theory, we search for a policy that, say, minimizes the expected infinite horizon discounted cost. Expectation is, of course, a risk neutral measure, which does not suffice in many applications, particularly in finance. We replace the expectation with a general risk functional, and call such models risk-aware MDP models. We consider minimization of such risk functionals in two cases, the expected utility framework, and conditional value-at-risk, a popular coherent risk measure. Later, we consider risk-aware MDPs wherein the risk is expressed in the constraints. This includes stochastic dominance constraints, and the classical chance-constrained optimization problems. In each case, we develop a convex analytic approach to solve such risk-aware MDPs. In most cases, we show that the problem can be formulated as an infinite-dimensional linear program (LP) in occupation measures when we augment the state space. We provide a discretization method and finite approximations for solving the resulting LPs. A striking result is that the chance-constrained MDP problem can be posed as an LP via the convex analytic method.

机译：在经典的马尔可夫决策过程（MDP）理论中，我们寻找一种策略，例如，将预期的无限期折现成本最小化。当然，期望是一种风险中性措施，在许多应用中，特别是在金融领域，这是不够的。我们用一般风险功能代替了预期，并称此类模型为风险感知MDP模型。我们考虑在两种情况下将此类风险功能最小化：预期效用框架和有条件的风险价值（一种流行的一致风险度量）。后来，我们考虑了风险感知型MDP，其中在约束中表达了风险。这包括随机优势约束和经典的机会约束优化问题。在每种情况下，我们都开发了一种凸分析方法来解决此类具有风险意识的MDP。在大多数情况下，我们表明，当我们扩大状态空间时，该问题可以用占领措施中的无穷维线性规划（LP）表示。我们提供了一种离散化方法和有限近似值来求解所得的LP。引人注目的结果是，可以通过凸分析方法将机会受限的MDP问题提出为LP。

著录项

来源
《SIAM Journal on Control and Optimization》 |2015年第3期|共30页
作者
Haskell William B.; Jain Rahul;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种 eng
中图分类运筹学;控制论、信息论（数学理论）;
关键词
Markov decision processes; stochastic optimization; risk measures; conditional value-at-risk; stochastic dominance constraints; convex analytic approach;

机译：马尔可夫决策过程;随机优化;风险测度;条件风险值;随机优势约束;凸分析法;

相似文献

外文文献
中文文献
专利

1. A CONVEX ANALYTIC APPROACH TO RISK-AWARE MARKOV DECISION PROCESSES [J] . Haskell William B., Jain Rahul SIAM Journal on Control and Optimization . 2015,第3期

机译：风险感知马尔可夫决策过程的凸分析方法
2. Convex analytic approach to constrained discounted Markov decision processes with non-constant discount factors [J] . Yi Zhang TOP . 2013,第2期

机译：具有非恒定折现因子的约束折现马尔可夫决策过程的凸解析方法
3. THE EXPECTED TOTAL COST CRITERION FOR MARKOV DECISION PROCESSES UNDER CONSTRAINTS: A CONVEX ANALYTIC APPROACH [J] . FRANCOIS DUFOUR, M. HORIGUCHI, A. B. PIUNOVSKIY Advances in applied probability . 2012,第3期

机译：约束条件下马尔可夫决策过程的预期总成本判据：一种凸分析方法
4. DISCOUNTED CONTINUOUS TIME MARKOV DECISION PROCESSES: THE CONVEX ANALYTIC APPROACH [C] . A.B. Piunovskiy IFAC (International Federation of Automatic Control) World Congress . 2005

机译：打折连续时间马尔可夫决策过程：凸分析方法
5. A hybrid genetic/optimization algorithm for piecewise affine and convex Markov decision processes. [D] . Lin, Zong-Zhi. 1999

机译：分段仿射和凸马尔可夫决策过程的混合遗传/优化算法。
6. Estimation of Survival Probabilities for Use in Cost-effectiveness Analyses: A Comparison of a Multi-state Modeling Survival Analysis Approach with Partitioned Survival and Markov Decision-Analytic Modeling [O] . Claire Williams, James D. Lewsey, Daniel F. Mackay, -1

机译：用于成本效益分析的生存概率估计：多状态建模的生存分析方法与分区生存和马尔可夫决策分析模型的比较
7. Multiobjective Stopping Problem for Discrete-Time Markov Processes: Convex Analytic Approach [O] . F. Dufour, A. B. Piunovskiy 2010

机译：离散时间马尔可夫流程的多目标停止问题：凸分析方法

A CONVEX ANALYTIC APPROACH TO RISK-AWARE MARKOV DECISION PROCESSES

摘要

著录项

相似文献

相关主题

期刊订阅