机译:Minimax PAC使用生成模型限制了强化学习的样本复杂度
Department of Biophysics Radboud University Nijmegen">(1);
School of Computer Science Carnegie Mellon University">(2);
INRIA Lille SequeL Project">(3);
Department of Biophysics Radboud University Nijmegen">(1);
Sample complexity; Markov decision processes; Reinforcement learning; Learning theory;
机译:Minimax PAC使用生成模型限制了强化学习的样本复杂度
机译:基于模型的增强学习,具有生成模型是最佳的最佳选择
机译:PAC学习半空间样本复杂度相对于均匀分布的上限
机译:论生成模型加固学习的样本复杂性
机译:简单加强学习的样本复杂性
机译:差异私立学习的示例复杂性界限
机译:minimax paC使用生成模型限制了强化学习的样本复杂性
机译:用随机集分析pac学习的复杂性界限。