System uncertainty; Robust control; Optimal control; Off-policy trinforcement learning; Model-free;
机译:基于非策略强化学习的离散时间不确定线性系统的数据驱动鲁棒控制
机译:通过截止策略强化学习对线性离散时间系统非零和游戏的最佳跟踪控制
机译:非策略交错的
机译:离散时间不确定线性系统鲁棒控制的禁止策略加固学习
机译:不确定系统的最优跟踪控制:基于策略和基于策略的强化学习方法
机译:一类具有时变时滞的不确定非线性系统的鲁棒自适应控制
机译:输出反馈H∞控制线性离散时间多人多人系统,使用脱离策略Q-Learning具有多源干扰