Answer set programming for non-stationary Markov decision processes

Ferreira Leonardo A.; Bianchi Reinaldo A. C.; Santos Paulo E.; Lopez de Mantaras Ramon

首页> 外文期刊>Applied Intelligence: The International Journal of Artificial Intelligence, Neural Networks, and Complex Problem-Solving Technologies >Answer set programming for non-stationary Markov decision processes

【24h】

Answer set programming for non-stationary Markov decision processes

机译：回答设置非静止马尔可夫决策过程的编程

获取原文

获取原文并翻译 | 示例

获取外文期刊封面目录资料

开具论文收录证明 >>

文献代查 >>

文献数据库（团队版） >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

Non-stationary domains, where unforeseen changes happen, present a challenge for agents to find an optimal policy for a sequential decision making problem. This work investigates a solution to this problem that combines Markov Decision Processes (MDP) and Reinforcement Learning (RL) with Answer Set Programming (ASP) in a method we call ASP(RL). In this method, Answer Set Programming is used to find the possible trajectories of an MDP, from where Reinforcement Learning is applied to learn the optimal policy of the problem. Results show that ASP(RL) is capable of efficiently finding the optimal solution of an MDP representing non-stationary domains.

机译：非静止域名，在不可预见的变化发生的情况下，对于代理人来说，为序贯决策问题找到最佳政策的挑战。这项工作调查了在我们调用ASP（RL）的方法中将Markov决策过程（MDP）和强化学习（RL）与答案设置编程（ASP）结合起来的解决方案。在该方法中，回答集编程用于找到MDP的可能轨迹，从应用增强学习来学习问题的最佳政策。结果表明，ASP（RL）能够有效地找到代表非静止结构域的MDP的最佳解决方案。

著录项

来源
《Applied Intelligence: The International Journal of Artificial Intelligence, Neural Networks, and Complex Problem-Solving Technologies》 |2017年第4期|共15页
作者
Ferreira Leonardo A.; Bianchi Reinaldo A. C.; Santos Paulo E.; Lopez de Mantaras Ramon;
展开▼
作者单位

Univ Metodista Sao Paulo Rua Alfeu Tavares 149 Sao Paulo Brazil;

Ctr Univ FEI Av Humberto Alencar Castelo Branco 3972 Sao Paulo Brazil;

Ctr Univ FEI Av Humberto Alencar Castelo Branco 3972 Sao Paulo Brazil;

Inst Invest Intelligencia Artificial Bellaterra 08193 Catalonia Spain;

展开▼
收录信息
原文格式 PDF
正文语种 eng
中图分类自动化技术、计算机技术;
关键词
Non-determinism; Markov decision processes; Answer set programming; Action languages;

机译：非确定性;马尔可夫决策过程;回答集编程;动作语言;

相似文献

外文文献
中文文献
专利

1. Answer set programming for non-stationary Markov decision processes [J] . Computing reviews . 2018,第6期

机译：非平稳马尔可夫决策过程的答案集编程
2. Linear programming formulation for non-stationary, finite-horizon Markov decision process models [J] . Arnab Bhattacharya, Jeffrey P. Kharoufeh Operations Research Letters: A Journal of the Operations Research Society of America . 2017,第6期

机译：非平稳，有限地平线马尔可夫决策过程模型的线性规划配方
3. Non-Stationary Semi-Markov Decision Processes on a Finite Horizon [J] . MRINAL K. GHOSH, SUBHAMAY SAHA Stochastic Analysis and Applications . 2013,第1期

机译：有限视野下的非平稳半马尔可夫决策过程
4. A Method for the Online Construction of the Set of States of a Markov Decision Process Using Answer Set Programming [C] . Leonardo Anjoletto Ferreira, Reinaldo A. C. Bianchi, Paulo E. Santos, International conference on industrial engineering and other applications of applied intelligent systems . 2018

机译：基于答案集编程的马尔可夫决策过程状态集在线构建方法
5. Computing a Probabilistic Extension of Answer Set Program Language Using ASP and Markov Logic Solvers [D] . Talsania, Samidh. 2017

机译：使用ASP和Markov Logic Solvers计算答案设置程序语言的概率扩展
6. Composition of Web Services Using Markov Decision Processes and Dynamic Programming [O] . Víctor Uc-Cetina, Francisco Moo-Mena, Rafael Hernandez-Ucan 2015

机译：使用Markov决策过程和动态规划的Web服务组合
7. Answer set programming for non-stationary Markov decision processes [O] . Ferreira, Leonardo A., Bianchi, Reinaldo, Santos, Paulo E., 2018

机译：非平稳马尔可夫决策过程的答案集编程
8. Non-Stationary Markov Decision Problems with Converging Parameters [R] . Federgruen, A., Schweitzer, P. J. 1978

机译：具有收敛参数的非平稳马尔可夫决策问题

Answer set programming for non-stationary Markov decision processes

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅