首页> 外文会议>Annual American Control Conference >Compositional planning in Markov decision processes: Temporal abstraction meets generalized logic composition

【24h】

Compositional planning in Markov decision processes: Temporal abstraction meets generalized logic composition

机译：马尔可夫决策过程中的组合计划：时间抽象符合广义逻辑组合

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

In hierarchical planning for Markov decision processes (MDPs), temporal abstraction allows planning with macro-actions that take place at different time scale in form of sequential composition. In this paper, we propose a novel approach to compositional reasoning and hierarchical planning for MDPs under co-safe temporal logic constraints. In addition to sequential composition, we introduce a composition of policies based on generalized logic composition: Given sub-policies for sub-tasks and a new task expressed as logic compositions of subtasks, a semi-optimal policy, which is optimal in planning with only sub-policies, can be obtained by simply composing sub-polices. Thus, a synthesis algorithm is developed to compute optimal policies efficiently by planning with primitive actions, policies for sub-tasks, and the compositions of sub-policies, for maximizing the probability of satisfying constraints specified in the fragment of co-safe temporal logic. We demonstrate the correctness and efficiency of the proposed method in stochastic planning examples with a single agent and multiple task specifications.

机译：在用于马尔可夫决策过程（MDP）的分层计划中，时间抽象允许进行具有宏观动作的计划，这些动作在不同的时间尺度上以顺序组合的形式发生。在本文中，我们提出了一种在共同安全的时间逻辑约束下对MDP进行组成推理和层次规划的新方法。除了顺序组合之外，我们还介绍了基于广义逻辑组合的策略组合：给定子任务的子策略和表示为子任务逻辑组合的新任务，这是一种半最优策略，在仅进行规划的情况下是最佳的子策略可以通过简单地组成子策略来获得。因此，开发了一种综合算法，可以通过使用原始动作，子任务策略以及子策略的组成进行规划来有效地计算最佳策略，以最大程度地满足在共同安全时间逻辑的片段中指定的约束的概率。我们在具有单个代理和多个任务规范的随机计划示例中证明了该方法的正确性和效率。

著录项

来源
《Annual American Control Conference》|2019年|559-566|共8页
会议地点
作者
Xuan Liu; Jie Fu;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词
decision theory; Markov processes; probability; temporal logic;

机译：决策理论;马尔可夫过程;概率;时间逻辑;

相似文献

外文文献
中文文献
专利

1. Online Planning for Large Markov Decision Processes with Hierarchical Decomposition [J] . Bai Aijun, Wu Feng, Chen Xiaoping ACM transactions on intelligent systems . 2015,第4期

机译：具有层次分解的大型Markov决策过程的在线计划
2. Learning Weighted Assumptions for Compositional Verification of Markov Decision Processes [J] . FEI HE, XIAOWEI GAO, MIAOFEI WANG, ACM transactions on software engineering and methodology . 2016,第3期

机译：学习加权假设以进行马尔可夫决策过程的组成验证
3. CEGAR for compositional analysis of qualitative properties in Markov decision processes [J] . Chatterjee Krishnendu, Chmelik Martin, Daca Przemyslaw Formal Methods in System Design . 2015,第2期

机译：CEGAR用于马尔可夫决策过程中定性性质的成分分析
4. Compositional planning in Markov decision processes: Temporal abstraction meets generalized logic composition [C] . Xuan Liu, Jie Fu Annual American Control Conference . 2019

机译：马尔可夫决策过程中的组成规划：时间抽象符合广义逻辑组合物
5. Compositional Abstractions for Verifying Concurrent Data Structures [D] . Krishna, Siddharth. 2019

机译：用于验证并发数据结构的组成抽象
6. Composition of Web Services Using Markov Decision Processes and Dynamic Programming [O] . Víctor Uc-Cetina, Francisco Moo-Mena, Rafael Hernandez-Ucan 2015

机译：使用Markov决策过程和动态规划的Web服务组合
7. Robust motion planning using Markov decision processes and quadtree decomposition [O] . Julien Burlet, Olivier Aycard, Thierry Fraichard 2004

机译：使用马尔可夫决策过程和四叉树分解的稳健运动规划

Compositional planning in Markov decision processes: Temporal abstraction meets generalized logic composition

摘要

著录项

相似文献

相关主题

期刊订阅