markov decision processes; planning; lagrange duality;
机译:有限规划范围内连续时间马尔可夫决策过程的最优决策
机译:马尔可夫决策过程中的可达性和安全目标长但有限的视野
机译:有限时间范围内连续时间马尔可夫决策过程的数值分析
机译:Lagrange双分解有限地平线马尔可夫决策过程
机译:用于部分可观察的马尔可夫决策过程的有限内存策略。
机译:不确定性下的决策:基于部分可观察的马尔可夫决策过程的神经模型
机译:有限地平线Markov决策过程的Lagrange对偶分解