Internal reinforcement learning; Nonzero-sum games; Optimal control; Partially unknown dynamics; Offline and online learning;
机译:利用禁止策略强化学习的离散时间系统的数据驱动非零游戏
机译:求解带有饱和执行器的非线性多人非零和博弈的积分强化学习非策略方法
机译:解决非线性连续时间多人非零和游戏的非策略整体强化学习方法
机译:部分未知非零和游戏的禁止促进学习
机译:医疗保健强度学习的违规政策评估
机译:多主体强化学习和近似模型学习的竞技游戏
机译:在线求解非零和微分对策的反馈纳什均衡的积分强化学习