机译:输出反馈Q学习控制,用于离散时间线性二次调节器问题
Univ Virginia Charles L Brown Dept Elect & Comp Engn Charlottesville VA 22904 USA;
Univ Virginia Charles L Brown Dept Elect & Comp Engn Charlottesville VA 22904 USA;
Approximate dynamic programming (ADP); linear quadratic regulation (LQR); output feedback; Q-learning; reinforcement learning (RL);
机译:离散线性二次调节器问题的输出反馈Q学习控制
机译:基于重放的输出反馈Q学习方案,用于离散线性系统的最佳输出跟踪控制
机译:结合强化Q学习和内部模型方法的未知离散时间线性系统的自适应最优输出反馈跟踪控制
机译:离散线性二次调节器问题的输出反馈增强Q学习控制
机译:使用状态反馈和输出反馈的小行星轨道航天器的线性和非线性自适应姿态控制
机译:具有信道衰落扇区非线性以及随机出现的间隔延迟和非线性的离散时间系统的模糊...公式输出反馈控制
机译:输出反馈H∞控制线性离散时间多人多人系统,使用脱离策略Q-Learning具有多源干扰