The University of Texas at Arlington.;
机译:可观察的马尔可夫决策过程的综合行动者评论模型
机译:可部分观察的马尔可夫决策过程的综合参与者-批评模型
机译:在一个杂乱的环境中使用马尔可夫决策过程的无人机的自由轨迹生成和跟踪
机译:处理动态变化环境的部分可观察马尔可夫决策过程
机译:Pond-hindsight:将事后观察优化应用于部分可观察到的马尔可夫决策过程。
机译:数据驱动决策支持的多目标马尔可夫决策过程
机译:用于处理动态变化环境的部分可观察的马尔可夫决策过程