VECTOR-VALUED MARKOV DECISION PROCESSES WITH AVERAGE REWARD CRITERION: THE MULTICHAIN CASE

Kazuyoshi Wakuta 20f

首页> 外文期刊>Probability in the Engineering and Informational Sciences >VECTOR-VALUED MARKOV DECISION PROCESSES WITH AVERAGE REWARD CRITERION: THE MULTICHAIN CASE

【24h】

VECTOR-VALUED MARKOV DECISION PROCESSES WITH AVERAGE REWARD CRITERION: THE MULTICHAIN CASE

机译：具有平均奖励标准的向量值马尔可夫决策过程：多链案例

获取原文

获取原文并翻译 | 示例

获取外文期刊封面封底 >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

We study the multichain case of a vector-valued Markov decision process with average reward criterion. We characterize optimal deterministic stationary policies via systems of linear inequalities and discuss a policy iteration algorithm for finding all optimal deterministic stationary policies.

机译：我们研究了具有平均奖励标准的向量值马尔可夫决策过程的多链案例。我们通过线性不等式系统描述最优确定性平稳策略的特征，并讨论用于找到所有最优确定性平稳策略的策略迭代算法。

著录项

来源
《Probability in the Engineering and Informational Sciences》 |2000年第4期|p.533-548|共16页
作者
Kazuyoshi Wakuta 20f;
展开▼
作者单位

展开▼
收录信息美国《科学引文索引》(SCI);
原文格式 PDF
正文语种 eng
中图分类工业技术;
关键词

相似文献

外文文献
中文文献
专利

1. On average reward semi-markov decision processes with a general multichain structure [J] . Jianyong L, Xiaobo Z Mathematics of operations research . 2004,第2期

机译：具有一般多链结构的平均奖励半马尔可夫决策过程
2. Achieving target state-action frequencies in multichain average-reward Markov decision processes [J] . Krass D., Vrieze OJ. Mathematics of operations research . 2002,第3期

机译：在多链平均奖励马尔可夫决策过程中实现目标状态作用频率
3. Reversible Markov decision processes with an average-reward criterion [J] . Cogill R., Peng C. SIAM Journal on Control and Optimization . 2013,第1期

机译：具有平均奖励标准的可逆马尔可夫决策过程
4. Bounded Parameter Markov Decision Processes with Average Reward Criterion [C] . Ambuj Tewari, Peter L. Bartlett Annual Conference on Learning Theory(COLT 2007); 20070613-15; San Diego,CA(US) . 2007

机译：具有平均奖励标准的有界参数马尔可夫决策过程
5. Regret-based reward elicitation for Markov decision processes. [D] . Kevin, Regan. 2014

机译：基于后悔的马尔可夫决策过程的奖励启发。
6. Developing a weighted reward criterion for the Markov-based decision of road maintenance [O] . Hui Gao, Xueqing Zhang, Yashuai Li -1

机译：为基于Markov的道路养护决策制定加权奖励标准
7. Bounded Parameter Markov Decision Processes with Average Reward Criterion [O] . Ambuj Tewari, Peter L. Bartlett 2010

机译：具有平均奖励准则的有界参数马尔可夫决策过程
8. Partially Observable Markov Decision Processes with an Average Cost Criterion. [R] . Fernandex-Gaucherand, E., Arapostathis, A., Marcus, S. I. 1989

机译：具有平均成本准则的部分可观察马尔可夫决策过程。

VECTOR-VALUED MARKOV DECISION PROCESSES WITH AVERAGE REWARD CRITERION: THE MULTICHAIN CASE

摘要

著录项

相似文献

相关主题

期刊订阅