Discrete-time systems; Reinforcement learning; Heuristic algorithms; Mathematical model; Symmetric matrices; Optimal control; System dynamics;
机译:增强Q学习,用于动态未知的线性离散时间系统的最优跟踪控制
机译:通过截止策略强化学习对线性离散时间系统非零和游戏的最佳跟踪控制
机译:带有饱和执行器和未知动力学的非线性系统的同步最优控制方法
机译:具有未知动力学的线性离散时间系统的最佳预览跟踪控制的禁止策略加强学习
机译:不确定系统的最优跟踪控制:基于策略和基于策略的强化学习方法
机译:线性离散时间非因果多速率系统的最优预览控制器设计
机译:使用Q-Learning完全未知动态的离散时间线性系统的有限视线最优控制
机译:非线性系统负载跟踪与参数跟踪的最优控制理论 - pontryagin最大值原理在反应堆动力学中的应用