...
首页> 外文期刊>Neural Networks and Learning Systems, IEEE Transactions on >Safe Approximate Dynamic Programming via Kernelized Lipschitz Estimation
【24h】

Safe Approximate Dynamic Programming via Kernelized Lipschitz Estimation

机译:通过内核leipschitz估计安全近似动态编程

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

We develop a method for obtaining safe initial policies for reinforcement learning via approximate dynamic programming (ADP) techniques for uncertain systems evolving with discrete-time dynamics. We employ the kernelized Lipschitz estimation to learn multiplier matrices that are used in semidefinite programming frameworks for computing admissible initial control policies with provably high probability. Such admissible controllers enable safe initialization and constraint enforcement while providing exponential stability of the equilibrium of the closed-loop system.
机译:我们开发了一种通过近似动态编程(ADP)技术来获得加强学习的安全初始政策的方法,以实现利用离散时间动态的不确定系统。我们采用内核leipschitz估计来学习用于SEMIDEFINITE编程框架中使用的乘法器矩阵,用于计算可允许的初始控制策略,具有可显着的高概率。此类可允许的控制器能够安全初始化和约束实施,同时提供闭环系统平衡的指数稳定性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号