Pursuit-Evasion; Continuous-time Markov Decision Process; Transition Rates Matrix; Dynamic Programming; Policy Iteration;
机译:基于连续时间马尔可夫决策过程的方法在逃避实例中的应用
机译:连续时间马尔可夫决策过程的变换方法
机译:连续时间马尔可夫决策过程的变换方法
机译:基于追求逃避问题的连续时间马尔可夫决策过程
机译:隐藏马尔可夫模型的现代方法和止痛性的部分可观察马尔可夫决策过程
机译:使用基于模型的建议对离散状态空间连续时间马尔可夫过程进行快速参数推断
机译:基于连续时间马尔可夫决策过程的动态电源管理