首页> 中国专利> 用于以轨迹为中心的基于模型的强化学习的稳健优化的系统及方法

用于以轨迹为中心的基于模型的强化学习的稳健优化的系统及方法

摘要

提供了用于优化用于以轨迹为中心的强化学习的系统的局部控制策略的控制器。控制器包括执行以下步骤:使用在使用初始随机控制策略执行的试错实验期间收集的数据的集合,来学习系统的随机预测模型;估计相关联的平均预测和不确定性;在当前时间步骤使用控制输入时,使用经过学习的随机系统模型确定系统与标称系统状态的偏差的局部集合;确定具有最坏情况偏差的系统状态;确定稳健性约束的梯度;使用非线性规划来提供并求解稳健策略优化问题,以获得系统轨迹并且同时稳定局部策略;根据求解的优化问题更新控制数据;以及经由接口输出更新后的控制数据。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-07-15

    公开

    国际专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号