Markov Decision Processes with Discounted Cost: The action elimination procedures

机译：马尔可夫决策流程，折扣成本：行动消除程序

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

Several accelerating procedures are developed for solving discounted Markov decisions processes problems. The most of them are focused on discounted reward by finding lower and upper bounds for the optimal value function. In the same framework, interested authors proposed some tests to eliminate non-optimal action in order to reduce de computational complexity.In this paper, we will present a new suboptimal test for the standard value iteration algorithm to minimize the discounted cost. This criterion has many applications areas like Economics and Management, Financial Modeling, Artificial Intelligence

机译：开发了几种加速程序，用于解决折扣马尔可夫决策过程问题。它们中的大多数是通过找到最佳值函数的下限和上限来专注于折扣奖励。在同一框架中，有兴趣的作者提出了一些测试来消除非最佳行动，以减少计算复杂性。在本文中，我们将为标准值迭代算法提供新的次优证测试，以最大限度地降低折扣成本。该标准具有许多应用领域，如经济和管理，金融建模，人工智能

著录项

来源
《International Conference of Computer Science and Renewable Energies》|2019年|449 p. :|共6页
会议地点
作者
Abdellatif SEMMOURI; Mostafa JOURHMANE;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类计算技术、计算机技术;
关键词
Markov processes; Planning; Upper bound; Standards; Process control; Control systems; Random variables;

机译：马尔可夫进程;规划;上限;标准;过程控制;控制系统;随机变量;

相似文献

外文文献
中文文献
专利

1. TIME-VARYING MARKOV DECISION PROCESSES WITH STATE-ACTION-DEPENDENT DISCOUNT FACTORS AND UNBOUNDED COSTS [J] . Escobedo-Trujillo Beatris A., Higuera-Chan Carmen G. Kybernetika . 2019,第1期

机译：时变马尔可夫决策过程，其状态依赖于折扣因素和成本不受限制
2. TIME-VARYING MARKOV DECISION PROCESSES WITH STATE-ACTION-DEPENDENT DISCOUNT FACTORS AND UNBOUNDED COSTS [J] . Escobedo-Trujillo Beatris A., Higuera-Chan Carmen G. Kybernetika . 2019,第1期

机译：时代的马尔可夫决策过程，具有国家依赖折扣因素和无限性成本
3. Discounted Markov Decision Processes with Constrained Costs: the decomposition approach [J] . Abdellatif Semmouri, Mostafa Jourhmane, Bahaa Eddine Elbaghazaoui E3S Web of Conferences . 2021,第a期

机译：折扣马尔可夫决策过程，具有约束力的成本：分解方法
4. Markov Decision Processes with Discounted Cost: The action elimination procedures [C] . Abdellatif SEMMOURI, Mostafa JOURHMANE 2019 International Conference of Computer Science and Renewable Energies . 2019

机译：折扣成本的马尔可夫决策过程：消除行动的程序
5. SEMI-MARKOV INVESTMENT DECISION PROCESSES WITH INFORMATION FLOW AND VARIABLE TRANSACTION COSTS. [D] . ZAHEDI-DADKHAH, FATEMEH. 1975

机译：具有信息流和可变交易成本的SEMI-MARKOV投资决策过程。
6. Decision Making Under Uncertainty: A Neural Model Based on Partially Observable Markov Decision Processes [O] . Rajesh P. N. Rao 2010

机译：不确定性下的决策：基于部分可观察的马尔可夫决策过程的神经模型
7. Iteration Algorithms in Markov Decision Processes with State- Action-Dependent Discount Factors and Unbounded Costs [O] . Fernando Luque-Vásquez, J. Adolfo Minjárez-Sosa 2016

机译：Markov决策过程中的迭代算法，具有依赖折扣因子和无限性成本
8. Two Short Notes on Markov Processes: I. A Test for Sub-Optimal Actions in Markovian Decision Problems. II. An Intrinsically Determined Markov Chain [R] . MacQueen, J. B. 1966

机译：关于马尔可夫过程的两个简短说明：I。马尔可夫决策问题中次优最优行动的检验。 II。本质上确定的马尔可夫链

Markov Decision Processes with Discounted Cost: The action elimination procedures

摘要

著录项

相似文献

相关主题

期刊订阅