Algorithms; Markov processes; Iterations; Decision theory; Computations; Dynamic programming;
机译:价值迭代最大化器何时接近折扣马尔可夫决策过程的最优平稳策略?缩小Borel空间理论与实际计算之间的差距
机译:具有受限成本和Borel空间的折扣马尔可夫决策模型的估计与近似策略迭代算法。
机译:折扣马尔可夫决策过程的改进值迭代算法
机译:对于折现马尔可夫决策过程,策略迭代的复杂性呈指数级增长
机译:利用折扣道路用户和机构成本的策略迭代算法的路面维护马尔瓦维亚优化模型
机译:使用局部可观察的马尔可夫决策过程对缺血性心脏病的治疗进行建模。
机译:折扣马尔可夫决策过程的值迭代算法的计算比较