The University of Texas at Arlington;
机译:通过截止策略强化学习对线性离散时间系统非零和游戏的最佳跟踪控制
机译:连续时间混沌系统的非策略积分强化学习最优跟踪控制
机译:
机译:非策略强化学习,用于动态未知的线性离散时间系统的最优预知跟踪控制
机译:基于数据的强化学习:不确定非线性系统的近似最优控制
机译:具有未知死区非线性的多输入不确定系统中指数轨迹跟踪的无奇异神经控制
机译:基于禁止促进强制增强学习的耐铁系统的最佳控制