机译:Borel空间上平均成本马尔可夫控制过程的策略迭代
(discrete-time) markov control processes; average cost; policy iteration (a.k.a. Howard's algorithm);
机译:Borel空间上平均成本马尔可夫控制过程的策略迭代
机译:具有BOREL空间和绑定成本的平均成本MARKOV决策过程的近似值迭代的扰动方法
机译:具有Borel空间和界限成本的平均成本马尔可夫决策过程近似值迭代的扰动方法
机译:具有无限成本和Borel空间的Markov决策过程的有限状态近似
机译:利用折扣道路用户和机构成本的策略迭代算法的路面维护马尔瓦维亚优化模型
机译:分段确定性马尔可夫过程的逼近方法及其成本
机译:具有Borel空间和界限成本的平均成本马尔可夫决策过程近似值迭代的扰动方法
机译:具有平均成本标准的离散时间控制马尔可夫过程:一项调查。