机译:Palo界限为部分可观察到的随机游戏中的加固学习
Univ Georgia Dept Comp Sci THINC Lab Athens GA 30602 USA;
Univ Georgia Dept Comp Sci THINC Lab Athens GA 30602 USA;
Univ Georgia Dept Comp Sci THINC Lab Athens GA 30602 USA;
Univ Southern Mississippi Sch Comp Sci & Comp Engn Hattiesburg MS 39406 USA;
Multiagent systems; Reinforcement learning; POMDP; POSG;
机译:具有基于采样状态估计的部分可观察游戏的基于模型的强化学习
机译:部分可观察的多智能体游戏的强化学习方案
机译:部分可观察的随机环境中的多任务强化学习
机译:在部分可观察到的多层设置中的加固学习:Monte Carlo探索PAC界的政策
机译:针对随机记忆对手的随机游戏中的强化学习。
机译:多主体强化学习和近似模型学习的竞技游戏
机译:Palo界限为部分可观察到的随机游戏中的加固学习