机译:通过强化学习对带有延迟的线性离散无模型系统的基于数据的最优控制
Northeastern Univ, Sch Informat Sci & Engn, Shenyang, Peoples R China;
Northeastern Univ, Sch Informat Sci & Engn, Shenyang, Peoples R China|Chinese Acad Sci, Inst Automat, State Key Lab Management & Control Complex Syst, Beijing, Peoples R China;
China Jiliang Univ, Coll Mech & Elect Engn, Hangzhou 310018, Zhejiang, Peoples R China;
Northeastern Univ, Sch Informat Sci & Engn, Shenyang, Peoples R China;
data-based optimal control; linear discrete time-delay system; model-free system; Q-learning; value iteration; reinforcement learning;
机译:基于数据的强化学习方法对完全未知的非线性离散时间马尔可夫跳跃系统的最优跟踪控制
机译:使用自适应动态规划的一类多延迟线性离散时间系统的无模型最优控制设计
机译:基于数据的增强学习对控制效果故障的不确定非线性系统的近似最优控制
机译:考虑线性离散时间系统L计算时延的基于强化学习的最优控制
机译:基于数据的强化学习:不确定非线性系统的近似最优控制
机译:使用无模型的深度强化学习以多尺度控制神经系统
机译:基于强化学习的线性参数化神经网络控制非仿射非线性离散系统
机译:离散时间内非线性随机系统的无模型控制