Efficient Computation of Time-Bounded Reachability Probabilities in Uniform Continuous-Time Markov Decision Processes

机译：均匀连续时间马尔可夫决策过程中有界可达概率的有效计算

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

A continuous-time Markov decision process (CTMDP) is a generalization of a continuous-time Markov chain in which both probabilistic and nondeterministic choices co-exist. This paper presents an efficient algorithm to compute the maximum (or minimum) probability to reach a set of goal states within a given time bound in a uniform CTMDP, i.e., a CTMDP in which the delay time distribution per state visit is the same for all states. We prove that these probabilities coincide for (time-abstract) history-dependent and Markovian schedulers that resolve nondeterminism either deterministically or in a randomized way.

机译：连续时间马尔可夫决策过程（CTMDP）是连续时间马尔可夫链的概括，其中概率选择和不确定性选择都共存。本文提出了一种有效的算法，用于计算在统一CTMDP中给定时间范围内达到一组目标状态的最大（或最小）概率，即一种CTMDP，其中每个状态访问的延迟时间分布对于所有状态。我们证明，这些概率对于（时间抽象）历史相关的和马尔可夫调度程序是一致的，这些调度程序可以确定性地或以随机方式解决不确定性。

著录项

来源
《Tools and Algorithms for the Construction and Analysis of Systems》|2004年|P.61-76|共16页
会议地点
作者
Christel Baier; Boudewijn Haverkort; Holger Hermanns; Joost-Pieter Katoen;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类设计与性能分析;
关键词

相似文献

外文文献
中文文献
专利

1. Efficient computation of time-bounded reachability probabilities in uniform continuous-time Markov decision processes [J] . Christel Baier, Holger Hermanns, Joost-Pieter Katoen, Theoretical computer science . 2005,第1期

机译：统一连续时间马尔可夫决策过程中有界可及性概率的高效计算
2. The risk probability criterion for discounted continuous-time Markov decision processes [J] . Huo Haifeng, Zou Xiaolong, Guo Xianping Discrete event dynamic systems: Theory and applications . 2017,第4期

机译：折扣连续时间马尔可夫决策过程的风险概率标准
3. Technical Note: A Computationally Efficient Algorithm For Undiscounted Markov Decision Processes With Restricted Observations [J] . Lauren B. Davis, Thom J. Hodgson, Russell E. King, Naval Research Logistics . 2009,第1期

机译：技术说明：具有有限观测值的无折扣马尔可夫决策过程的一种计算有效算法
4. Efficient Computation of Time-Bounded Reachability Probabilities in Uniform Continuous-Time Markov Decision Processes [C] . Christel Baier, Boudewijn Haverkort, Holger Hermanns, International Conference on Tools and Algorithms for the Construction and Analysis of Systems . 2004

机译：高效计算均匀连续时间马尔可夫决策过程中的时间界可达性概率
5. Increasing scalability in algorithms for centralized and decentralized partially observable Markov decision processes: Efficient decision-making and coordination in uncertain environments. [D] . Amato, Christopher. 2010

机译：用于集中式和分散式部分可观察的马尔可夫决策过程的算法中的可伸缩性不断增强：在不确定的环境中进行有效的决策和协调。
6. Efficient Transition Probability Computation for Continuous-Time Branching Processes via Compressed Sensing [O] . Jason Xu, Vladimir N. Minin -1

机译：通过压缩感测的连续时间分支过程的有效转移概率计算
7. Efficient computation of time-bounded reachability probabilities in uniform continuous-time Markov decision processes [O] . Baier, Christel, Hermanns, H., Katoen, Joost P., 2005

机译：统一连续时间马尔可夫决策过程中时限可达性概率的高效计算

Efficient Computation of Time-Bounded Reachability Probabilities in Uniform Continuous-Time Markov Decision Processes

摘要

著录项

相似文献

相关主题

期刊订阅