首页> 外文期刊>Neurocomputing >Adaptive optimal tracking control for nonlinear continuous-time systems with time delay using value iteration algorithm
【24h】

Adaptive optimal tracking control for nonlinear continuous-time systems with time delay using value iteration algorithm

机译:利用价值迭代算法的时间延迟非线性连续时间系统的自适应最优跟踪控制

获取原文
获取原文并翻译 | 示例
           

摘要

In this paper, an integral reinforcement learning-based value iteration algorithm is developed for solving the infinite horizon optimal tracking control problem of nonlinear continuous-time systems with time delay. The main idea is using the value iteration technique to obtain the iterative control law, which optimizes the iterative performance index function. In contrast to the existing value iteration algorithms, the proposed IRL-based value iteration algorithm takes the time delay into account. Second, the convergence analysis of the proposed algorithm is given for the nonlinear continuous-time systems with time delay. Moreover, the critic neural network is utilized to approximate the performance index function and compute the optimal control law for facilitating the implementation of the iterative algorithm. Finally, the simulation results are presented to illustrate the effectiveness of the developed method. (C) 2019 Elsevier B.V. All rights reserved.
机译:在本文中,开发了一种基于积分的基于基于基于的基于价值迭代算法,用于解决时间延迟非线性连续时间系统的无限地平线最优跟踪控制问题。主要思想正在使用价值迭代技术来获得迭代控制法,该迭代控制法优化迭代性能指数函数。与现有的值迭代算法相比,所提出的基于IRL的值迭代算法考虑了时间延迟。其次,具有时间延迟的非线性连续时间系统给出了所提出的算法的收敛分析。此外,评论批评神经网络用于近似性能指标功能,并计算促进迭代算法的实现的最优控制法。最后,提出了模拟结果以说明开发方法的有效性。 (c)2019 Elsevier B.v.保留所有权利。

著录项

  • 来源
    《Neurocomputing》 |2020年第jul5期|172-178|共7页
  • 作者单位

    Nanjing Univ Posts & Telecommun Coll Automat Nanjing Peoples R China;

    Nanjing Univ Posts & Telecommun Coll Automat Nanjing Peoples R China|Nanjing Univ Posts & Telecommun Inst Adv Technol Nanjing Peoples R China;

    Nanjing Univ Posts & Telecommun Inst Adv Technol Nanjing Peoples R China;

  • 收录信息 美国《科学引文索引》(SCI);美国《工程索引》(EI);
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

    Reinforcement learning; Tracking control; Time delay; Value iteration;

    机译:加强学习;跟踪控制;时间延迟;价值迭代;

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号