首页> 外文OA文献 >Optimal control and inverse optimal control by distribution matching
【2h】

Optimal control and inverse optimal control by distribution matching

机译:分布匹配的最优控制和逆最优控制

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Optimal control is a powerful approach to achieve optimal behavior. However, it typically requires a manual specification of a cost function which often contains several objectives, such as reaching goal positions at different time steps or energy efficiency. Manually trading-off these objectives is often difficult and requires a high engineering effort. In this paper, we present a new approach to specify optimal behavior. We directly specify the desired behavior by a distribution over future states or features of the states. For example, the experimenter could choose to reach certain mean positions with given accuracy/variance at specified time steps. Our approach also unifies optimal control and inverse optimal control in one framework. Given a desired state distribution, we estimate a cost function such that the optimal controller matches the desired distribution. If the desired distribution is estimated from expert demonstrations, our approach performs inverse optimal control. We evaluate our approach on several optimal and inverse optimal control tasks on non-linear systems using incremental linearizations similar to differential dynamic programming approaches.
机译:最佳控制是实现最佳行为的强大方法。但是,它通常需要成本函数的手动说明,该成本函数通常包含多个目标,例如在不同时间步长达到目标位置或提高能源效率。手动权衡这些目标通常很困难,并且需要大量的工程工作。在本文中,我们提出了一种指定最佳行为的新方法。我们通过将来状态或状态特征的分布直接指定所需的行为。例如,实验者可以选择在指定的时间步长以给定的精度/方差到达某些平均位置。我们的方法还在一个框架中统一了最优控制和逆最优控制。给定所需的状态分布,我们估算成本函数,以使最佳控制器与所需的分布相匹配。如果根据专家演示估计了所需的分布,则我们的方法将执行逆最优控制。我们使用类似于差分动态规划方法的增量线性化方法,对非线性系统上的几种最优和逆最优控制任务进行评估。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号