...
机译:具有不变不变探索的连续时间仿射非线性系统的整体强化学习
Department of Electrical and Electronic Engineering, Yonsei University, Seoul, Korea;
Convergence; Equations; Heuristic algorithms; Nonlinear systems; Optimal control; Stability analysis; Adaptive optimal control; Q-learning; continuous-time (CT); exploration; policy iteration (PI); reinforcement learning (RL);
机译:基于整体加固学习的自适应NN控制,用于具有未知控制方向的连续时间非线性MIMO系统
机译:连续非线性系统H∞控制器设计的基于值迭代的积分强化学习方法
机译:解决非线性连续时间多人非零和游戏的非策略整体强化学习方法
机译:连续时间非线性系统探索中的整体强化学习
机译:基于数据的强化学习:不确定非线性系统的近似最优控制
机译:控制非线性动力学系统的Koopman不变子空间和有限线性表示
机译:具有非周期采样数据控制的某类输入仿射非线性系统的稳定性分析