首页> 美国卫生研究院文献>other >Hidden Parameter Markov Decision Processes: A Semiparametric Regression Approach for Discovering Latent Task Parametrizations
【2h】

Hidden Parameter Markov Decision Processes: A Semiparametric Regression Approach for Discovering Latent Task Parametrizations

机译:隐参数马尔可夫决策过程:发现潜在任务参数化的半参数回归方法

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Control applications often feature tasks with similar, but not identical, dynamics. We introduce the Hidden Parameter Markov Decision Process (HiP-MDP), a framework that parametrizes a family of related dynamical systems with a low-dimensional set of latent factors, and introduce a semiparametric regression approach for learning its structure from data. We show that a learned HiP-MDP rapidly identifies the dynamics of new task instances in several settings, flexibly adapting to task variation.
机译:控制应用程序通常具有动态相似但不相同的任务。我们介绍了隐参数马尔可夫决策过程(HiP-MDP),该框架对具有低维潜在因子集的一系列相关动力学系统进行了参数化,并介绍了一种半参数回归方法,用于从数据中学习其结构。我们显示,学习过的HiP-MDP可在多个设置中快速识别新任务实例的动态,从而灵活地适应任务变化。

著录项

  • 期刊名称 other
  • 作者单位
  • 年(卷),期 -1(2016),-1
  • 年度 -1
  • 页码 1432–1440
  • 总页数 23
  • 原文格式 PDF
  • 正文语种
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号