机译:连续时间和空间中的强化学习
机译:连续时间和空间的加固学习:随机控制方法
机译:连续时间和空间中的强化学习:使用分布式函数逼近器时的主要问题是干扰和非病态调节
机译:高维连续状态空间的强化学习-一种基于多元分析的状态空间压缩方法-
机译:基于强化学习的连续时间在线航天器动力学控制:NASA SPHERES航天器案例研究
机译:用于随机连续时间增强学习问题的平滑框架
机译:更正:在连续状态和动作空间中基于峰值的强化学习:当策略梯度方法失败时
机译:连续时间和空间中加强学习问题的政策迭代 - 基础理论与方法