首页> 外文会议>International Conference on Operations Research >Algorithmic Procedures for Mean Variance Optimality in Markov Decision Chains

【24h】

Algorithmic Procedures for Mean Variance Optimality in Markov Decision Chains

机译：马尔可夫决策链中平均方差最优性的算法过程

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

In this note we discuss some algorithmic procedures for finding optimal policies of Markov decision chains with respect to various mean variance optimality criteria. To this end, we present formulas for the growth rate and asymptotic behavior of the variance of total cumulative reward. Finally, algorithmic procedures of policy iteration type for finding efficient policies with respect to various mean variance optimality criteria along with computational experience are discussed.

机译：在本说明中，我们讨论了一些算法过程，用于查找关于各种平均方差最优性标准的马尔可夫决策链的最佳策略。为此，我们为总累积奖励方差的增长率和渐近行为提供公式。最后，讨论了用于查找关于各种平均方差最优性标准的有效策略的政策迭代类型的算法过程以及计算经验。

著录项

来源
《International Conference on Operations Research 》|2006年||共6页
会议地点
作者
Karel Sladky; Milan Sitaf;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类 O22-532;
关键词

相似文献

外文文献
中文文献
专利

1. Variance minimization and the overtaking optimality approach to continuous-time controlled Markov chains [J] . Tomás Prieto-Rumeau, Onésimo Hernández-Lerma Mathematical Methods of Operations Research . 2009 ,第3期

机译：连续时间受控马尔可夫链的方差最小化和超车最优方法
2. Variance minimization and the overtaking optimality approach to continuous-time controlled Markov chains [J] . Prieto-Rumeau T, Hernandez-Lerma O Mathematical methods of operations research . 2009 ,第3期

机译：连续时间受控马尔可夫链的方差最小化和超车最优方法
3. VARIANCE REDUCTION ALGORITHMS FOR PARALLEL REPLICATED SIMULATION OF UNIFORMIZED MARKOV CHAINS [J] . Streltsov S., Vakili P. Discrete event dynamic systems: Theory and applications . 1996 ,第2期

机译：均匀化马尔可夫链的并行复制模拟的方差约简算法
4. Algorithmic Procedures for Mean Variance Optimality in Markov Decision Chains [C] . Karel Sladky, Milan Sitaf International Conference on Operations Research . 2006

机译：马尔可夫决策链中平均方差最优性的算法过程
5. Optimal Variance Estimation for a Multivariate Markov Chain Central Limit Theorem. [D] . Liu, Ying. 2017

机译：多元马尔可夫链中心极限定理的最优方差估计。
6. Marathon: An Open Source Software Library for the Analysis of Markov-Chain Monte Carlo Algorithms [O] . Steffen Rechner, Annabell Berger 2011

机译：Marathon：一个用于分析马尔可夫链蒙特卡洛算法的开源软件库
7. Variance Reduction Algorithms for Parallel Replicated Simulation of Uniformized Markov Chains [O] . Simon Streltsov, Pirooz Vakili 1996

机译：均匀马尔可夫链并行复制仿真的方差约简算法
8. Finding Optimal Policies for Markov Decision Chains: A Unifying Framework for Mean-Variance-Tradeoffs (Revised) [R] . Huang, Y., Kallenberg, L. C. M. 1993

机译：寻找马尔可夫决策链的最优政策：均值 - 方差 - 权衡的统一框架（修订）

Algorithmic Procedures for Mean Variance Optimality in Markov Decision Chains

摘要

著录项

相似文献

相关主题

期刊订阅