Markov processes; Planning; Upper bound; Standards; Process control; Control systems; Random variables;
机译:时变马尔可夫决策过程,其状态依赖于折扣因素和成本不受限制
机译:时代的马尔可夫决策过程,具有国家依赖折扣因素和无限性成本
机译:折扣马尔可夫决策过程,具有约束力的成本:分解方法
机译:折扣成本的马尔可夫决策过程:消除行动的程序
机译:具有信息流和可变交易成本的SEMI-MARKOV投资决策过程。
机译:不确定性下的决策:基于部分可观察的马尔可夫决策过程的神经模型
机译:Markov决策过程中的迭代算法,具有依赖折扣因子和无限性成本
机译:关于马尔可夫过程的两个简短说明:I。马尔可夫决策问题中次优最优行动的检验。 II。本质上确定的马尔可夫链