机译:连续时间和空间中的强化学习:使用分布式函数逼近器时的主要问题是干扰和非病态调节
机译:连续空间控制任务中条件强化学习的实验
机译:连续时间和空间的加固学习:随机控制方法
机译:连续时间和空间中的强化学习
机译:在连续时间和空间中加强学习:干扰且不良状态是使用分布式功能近似器时的主要问题
机译:时间无关和时间相关的小波包方法使用分布式近似函数进行量子动力学。
机译:更正:在连续状态和动作空间中基于峰值的强化学习:当策略梯度方法失败时
机译:机器人控制中连续空间强化学习的值函数逼近
机译:分布式强化学习中的最优奖励函数