Optimal control; Policy iteration; Actorcritics; Neural networks;
机译:在线actor-critic算法解决连续时间无限视界最优控制问题
机译:仿射非线性连续时间系统的事件采样神经动力学规划的近似最优控制
机译:基于通用值迭代的强化学习,用于求解连续时间仿射非线性系统的最优跟踪控制问题
机译:在线仿生批评算法的仿射非线性连续时间系统的最优控制
机译:连续时间系统的在线自适应最优控制。
机译:强凸可行集的梯度方法和仿射系统的最优控制
机译:动力学完全未知的连续时间非线性系统的在线自适应最优控制