H; control; game algebraic Riccati equation; off-policy; reinforcement learning;
机译:通过截止策略强化学习对线性离散时间系统非零和游戏的最佳跟踪控制
机译:带有饱和执行器和未知动力学的非线性系统的同步最优控制方法
机译:饱和致动器饱和致动器的非线性系统的同步最优控制方法,使用脱策积分增强学习
机译:H
机译:不确定系统的最优跟踪控制:基于策略和基于策略的强化学习方法
机译:趋磁细菌中磁铁矿(Fe(inf3)O(inf4))和钙铁矿(Fe(inf3)S(inf4))的受控生物矿化
机译:使用Q-Learning完全未知动态的离散时间线性系统的有限视线最优控制
机译:离散时间超最优H sup Inf控制问题的状态空间方法