Carnegie Mellon University.;
机译:具有BOREL空间和绑定成本的平均成本MARKOV决策过程的近似值迭代的扰动方法
机译:具有Borel空间和界限成本的平均成本马尔可夫决策过程近似值迭代的扰动方法
机译:通过近似策略改进对一般Markov决策过程进行时间逻辑控制
机译:马尔可夫链蒙特卡洛方法的半马尔可夫决策过程的近似解
机译:马尔可夫决策过程中的多阶段决策和风险:建立有效的近似动态编程体系结构。
机译:不确定性下的决策:基于部分可观察的马尔可夫决策过程的神经模型
机译:DetH *:大马尔可夫决策过程的近似层次解