机译:连续时间马尔可夫决策过程的变换方法
Department of Mathematical Sciences, University of Liverpool, Liverpool, L69 7ZL, UK;
Department of Mathematical Sciences, University of Liverpool, Liverpool, L69 7ZL, UK;
Discrete-time Markov decision process; Continuous-time Markov decision process; Unbounded transition rates; Transformation method; History-dependent policies;
机译:连续时间马尔可夫决策过程的变换方法
机译:连续时间马尔可夫过程偏差矩阵的一种近似方法及其在马尔可夫决策理论中的应用
机译:使用高斯过程的连续时间马尔可夫决策过程中的策略学习
机译:连续时间马尔可夫决策过程的马尔可夫策略的充分性以及跳跃马尔可夫过程的Kolmogorov正方程的解
机译:隐藏马尔可夫模型的现代方法和止痛性的部分可观察马尔可夫决策过程
机译:使用基于模型的建议对离散状态空间连续时间马尔可夫过程进行快速参数推断
机译:连续时间马尔可夫过程偏差矩阵的一种近似方法及其在马尔可夫决策理论中的应用