LORIA, Campus Scientifique BP239 -F54506 Vandoeuvre-Ies-Nancy;
action selection and planning; coordinating multi-agent activites; evolution adaptation and learning; markov decision processes;
机译:有限规划范围内连续时间马尔可夫决策过程的最优决策
机译:使用分层约束的马尔可夫决策过程计划
机译:使用马尔可夫决策过程的地面延迟程序计划
机译:马可夫决策过程中的协同进化规划
机译:约束马尔可夫决策过程的机器人规划
机译:不确定性下的决策:基于部分可观察的马尔可夫决策过程的神经模型
机译:基于图形的马尔可夫决策过程规划的变分刺痛方法
机译:关于马尔可夫过程的两个简短说明:I。马尔可夫决策问题中次优最优行动的检验。 II。本质上确定的马尔可夫链