机译:利用Lyapunov稳定性理论对强化学习的原则奖励塑造
Huazhong Univ Sci & Technol Sch Artificial Intelligence & Automat Key Lab Imaging Proc & Intelligent Control State Key Lab Digital Mfg Equipments & Technol Wuhan 430074 Peoples R China;
Huazhong Univ Sci & Technol Sch Artificial Intelligence & Automat Key Lab Imaging Proc & Intelligent Control State Key Lab Digital Mfg Equipments & Technol Wuhan 430074 Peoples R China;
Huazhong Univ Sci & Technol Sch Artificial Intelligence & Automat Key Lab Imaging Proc & Intelligent Control State Key Lab Digital Mfg Equipments & Technol Wuhan 430074 Peoples R China;
Reinforcement learning; Principled reward shaping; Lyapunov stability theory; Stochastic approximation;
机译:利用Lyapunov稳定性概念和模糊奖励方案的加强基于非线性系统的控制
机译:在线学习塑造强化学习中的奖励。
机译:基于Lyapunov稳定性的强化学习自适应T-S模糊控制器。
机译:强化学习政策空间中的健身景观特征和奖励塑造
机译:奖励塑造在强化学习中的理论与应用。
机译:增强Q学习控制在半主动假肢膝关节中为摆动相位控制的奖励塑造功能
机译:奖励塑造在强化学习中的理论与应用
机译:从人类奖励中学习强化学习:奖励积极性,时间贴现,情节性和表现。