Concurrent MDPs with Finite Markovian Policies

机译：具有有限马尔可夫策略的并行MDP

获取原文

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

The recently defined class of Concurrent Markov Decision Processes (CMDPs) allows one to describe scenario based uncertainty in sequential decision problems like scheduling or admission problems. The resulting optimization problem of computing an optimal policy is NP-hard. This paper introduces a new class of policies for CMDPs on infinite horizons. A mixed integer linear program and an efficient approximation algorithm based on policy iteration are defined for the computation of optimal polices. The proposed approximation algorithm also improves the available approximate value iteration algorithm for the finite horizon . case.

机译：最近定义的一类并行马尔可夫决策过程（CMDP）允许人们描述诸如调度或准入问题之类的顺序决策问题中基于场景的不确定性。由此产生的计算最优策略的优化问题是NP难的。本文介绍了针对无限范围内的CMDP的一类新策略。定义了混合整数线性程序和基于策略迭代的有效逼近算法，用于计算最优策略。所提出的近似算法也改进了有限层的可用近似值迭代算法。案子。

著录项

来源
《International GI/ITG Conference on Measurement, Modelling and Evaluation of Computing Systems》|2020年|37-53|共17页
会议地点
作者
Peter Buchholz; Dimitri Scheftelowitsch;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词
Concurrent Markov Decision Processes; Optimal policies; Robust optimization; Integer linear programming; Local search heuristics;

机译：并行马尔可夫决策过程;最佳政策;稳健的优化;整数线性规划;本地搜索启发式;

相似文献

外文文献
中文文献
专利

1. Computation of weighted sums of rewards for concurrent MDPs [J] . Buchholz Peter, Scheftelowitsch Dimitri Mathematical methods of operations research . 2019,第1期

机译：计算并发MDPS奖励加权和的计算
2. Compositional Construction of Finite MDPs for Continuous-Time Stochastic Systems: A Dissipativity Approach ? [J] . Ameneh Nejati, Majid Zamani IFAC PapersOnLine . 2020,第2期

机译：连续时间随机系统有限MDP的组成结构：耗散方法？
3. Compositional Construction of Finite MDPs for Large-Scale Stochastic Switched Systems: A Dissipativity Approach [J] . Abolfazl Lavaei, Majid Zamani IFAC PapersOnLine . 2019,第3期

机译：大型随机切换系统有限MDP的组成构造：耗散方法
4. Markovian State and Action Abstractions for MDPs via Hierarchical MCTS [C] . Aijun Bai, Siddharth Srivastava, Stuart Russell International Joint Conference on Artificial Intelligence . 2016

机译：MAKOVIAN和MDPS通过分层MCTS的行动抽象
5. Stability analysis of jump-linear systems driven by finite-state machines with Markovian inputs. [D] . Patilkulkarni, Sudarshan S. 2004

机译：具有马尔可夫输入的有限状态机驱动的跳跃线性系统的稳定性分析。
6. Context/Resource-Aware Mission Planning Based on BNs and Concurrent MDPs for Autonomous UAVs [O] . Chabha Hireche, Catherine Dezan, Stéphane Mocanu, 2018

机译：基于BN和并发MDP的自主无人机的上下文/资源感知任务计划
7. Context/Resource-Aware Mission Planning Based on BNs and Concurrent MDPs for Autonomous UAVs [O] . Chabha Hireche, Catherine Dezan, Stéphane Mocanu, 2018

机译：基于BNS的上下文/资源感知任务规划和自主无人机的并发MDP
8. Computational Methods for Finite State Finite Valued Markovian Decision Problems [R] . Totten, J. C. 1971

机译：有限状态有限值马尔可夫决策问题的计算方法

Concurrent MDPs with Finite Markovian Policies

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅