...
机译:带有扰动的未知系统最优控制的非策略性Actor-Critical结构
School of Automation and Electrical Engineering, University of Science and Technology Beijing, Beijing, China;
Adaptive critic designs; adaptive/approximate dynamic programming (ADP); dynamic programming; off-policy; optimal control; unknown system;
机译:带有饱和执行器和未知动力学的非线性系统的同步最优控制方法
机译:饱和致动器饱和致动器的非线性系统的同步最优控制方法,使用脱策积分增强学习
机译:基于非策略强化学习的未知连续时间线性系统的最优输出反馈控制
机译:非策略强化学习,用于动态未知的线性离散时间系统的最优预知跟踪控制
机译:不确定系统的最优跟踪控制:基于策略和基于策略的强化学习方法
机译:PMSM速度伺服系统的最佳分数阶主动干扰抑制控制器设计
机译:输出反馈H∞控制线性离散时间多人多人系统,使用脱离策略Q-Learning具有多源干扰
机译:具有未知扰动的系统的预测反馈和前馈控制