机译:通过截止策略强化学习对线性离散时间系统非零和游戏的最佳跟踪控制
discrete-time; non-zero-sum games; off-policy; optimal tracking control;
机译:通过截止策略强化学习对线性离散时间系统非零和游戏的最佳跟踪控制
机译:基于数据的强化学习方法对完全未知的非线性离散时间马尔可夫跳跃系统的最优跟踪控制
机译:增强Q学习,用于动态未知的线性离散时间系统的最优跟踪控制
机译:非策略强化学习,用于动态未知的线性离散时间系统的最优预知跟踪控制
机译:不确定系统的最优跟踪控制:基于策略和基于策略的强化学习方法
机译:线性离散时间非因果多速率系统的最优预览控制器设计
机译:输出反馈H∞控制线性离散时间多人多人系统,使用脱离策略Q-Learning具有多源干扰