首页> 外文期刊>Control Systems, IEEE >Reinforcement Learning and Feedback Control: Using Natural Decision Methods to Design Optimal Adaptive Controllers
【24h】

Reinforcement Learning and Feedback Control: Using Natural Decision Methods to Design Optimal Adaptive Controllers

机译:强化学习和反馈控制:使用自然决策方法设计最佳自适应控制器

获取原文
获取原文并翻译 | 示例
       

摘要

This article describes the use of principles of reinforcement learning to design feedback controllers for discrete- and continuous-time dynamical systems that combine features of adaptive control and optimal control. Adaptive control [1], [2] and optimal control [3] represent different philosophies for designing feedback controllers. Optimal controllers are normally designed of ine by solving Hamilton JacobiBellman (HJB) equations, for example, the Riccati equation, using complete knowledge of the system dynamics. Determining optimal control policies for nonlinear systems requires the offline solution of nonlinear HJB equations, which are often difficult or impossible to solve. By contrast, adaptive controllers learn online to control unknown systems using data measured in real time along the system trajectories. Adaptive controllers are not usually designed to be optimal in the sense of minimizing user-prescribed performance functions. Indirect adaptive controllers use system identification techniques to first identify the system parameters and then use the obtained model to solve optimal design equations [1]. Adaptive controllers may satisfy certain inverse optimality conditions [4].
机译:本文介绍了如何使用强化学习原理为离散和连续时间动力系统设计反馈控制器,该控制器结合了自适应控制和最优控制的功能。自适应控制[1],[2]和最佳控制[3]代表了设计反馈控制器的不同理念。通常,通过使用完整的系统动力学知识来求解Hamilton JacobiBellman(HJB)方程(例如Riccati方程)来设计最优控制器。确定非线性系统的最优控制策略需要非线性HJB方程的离线解,这通常很难或不可能解决。相比之下,自适应控制器会在线学习以使用沿系统轨迹实时测量的数据来控制未知系统。从最小化用户指定的性能功能的角度来看,自适应控制器通常设计得不是最佳的。间接自适应控制器使用系统识别技术首先识别系统参数,然后使用获得的模型来求解最佳设计方程[1]。自适应控制器可以满足某些逆最优条件[4]。

著录项

  • 来源
    《Control Systems, IEEE》 |2012年第6期|76-105|共30页
  • 作者单位

    Autom. & Robot. Res. Inst., Univ. of Texas at Arlington, Worth, TX, USA|c|;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

  • 入库时间 2022-08-18 01:17:00

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号