McGill University, School of Computer Science, 3480 University St., Montreal, QC, Canada, H3A2A7;
机译:具有奖励信息的部分可观察的马尔可夫决策过程:基本思想和模型
机译:具有奖励信息的部分可观察的马尔可夫决策过程:基本思想和模型
机译:使用置信空间宏作用的多机器人部分可观察的马尔可夫决策过程的分散控制
机译:在部分可观察到的马尔可夫决策过程中使用奖励进行信仰状态更新
机译:隐藏马尔可夫模型的现代方法和止痛性的部分可观察马尔可夫决策过程
机译:不确定性下的决策:基于部分可观察的马尔可夫决策过程的神经模型
机译:利用置信空间宏观行为对部分可观测马尔可夫决策过程的分散控制