首页> 外文期刊>Artificial Intelligence Review: An International Science and Engineering Journal >Comprehensive comparison of online ADP algorithms for continuous-time optimal control
【24h】

Comprehensive comparison of online ADP algorithms for continuous-time optimal control

机译:在线ADP算法进行全面比较连续时间最优控制

获取原文
获取原文并翻译 | 示例
           

摘要

Online learning is an important property of adaptive dynamic programming (ADP). Online observations contain plentiful dynamics information, and ADP algorithms can utilize them to learn the optimal control policy. This paper reviews the research of online ADP algorithms for the optimal control of continuous-time systems. With the intensive study, ADP has been developed towards model free and data efficient. After separately introducing the algorithms, we compare their performance on the same problem. This paper is desired to provide a comprehensive understanding of continuous-time online ADP algorithms.
机译:在线学习是自适应动态编程(ADP)的重要属性。 在线观察包含丰富的动态信息,ADP算法可以利用它们来学习最佳控制策略。 本文综述了在线ADP算法的研究,以实现连续时间系统的最佳控制。 随着密集的研究,ADP已经开发了模型自由和数据效率。 单独介绍算法后,我们将其性能与同一问题进行比较。 希望本文能够全面了解连续时间在线ADP算法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号