...
首页> 外文期刊>Engineering Economics >Learning a Transferable World Model by Reinforcement Agent in Deterministic Observable Grid-World Environments
【24h】

Learning a Transferable World Model by Reinforcement Agent in Deterministic Observable Grid-World Environments

机译:在确定的可观察网格-世界环境中,通过增强代理学习可转移的世界模型

获取原文
   

获取外文期刊封面封底 >>

       

摘要

Pastiprinimu paremti agentai mokytis susiduria su problemomis perkeldami vienoje aplinkoje ?gytas ?inias ? naujasaplinkas: taip nutinka d?l receptori? pateikim? interpretavimo būdo ir mechanizm?, leid?ian?i? tinkamai apibendrinti receptori?pateikimus, trūkumo. Straipsnyje ?i ?ini? perkeliamumo problema yra sprend?iama pasiūlius agent?, kuris taiko sprendim?med?io indukcijos ir konstrukcin?s indukcijos metodus, o receptori? pateikimus interpretuoja kaip paskirstyt? savybi? rinkin?.Prad?damas darb? agentas neturi joki? ?ini? nei apie aplink?, nei apie savo veiksm? pasekmes. Jis i?moksta pasaulio model?(sprendim? med?i? rinkin?), atitinkant? i?samius veiksm? apra?ymus, pagal kur? turint konkre?ius receptori? pateikimus, galimaprognozuoti veiksm? pasekmes. Agento planavimo komponent?, paremta paie?kos platyn metodu: ji ie?ko veiksm? grandini?nuo vienos aplinkos situacijos iki kitos naudodama pasaulio model? ir pagal j? suprognozuotus receptori? pateikimus. Pasiūlytasmetodas palygintas su Q-mokymo ir Adaptyvaus dinaminio programavimo metodais: pateiktos metod? galimyb?s siekti tiksl?statin?se stebimose deterministin?se i? laukeli? sudarytose aplinkose, taikant ne toje pa?ioje aplinkoje i?moktus pasauliomodelius.DOI: http://dx.doi.org/10.5755/j01.itc.41.4.915
机译:基于增强的学习代理在传递单个环境中获得的知识时面临挑战。新环境:这是由于受体吗?介绍?解释的方法和机制正确总结缺乏受体的表现。在文章中?通过提出一种将溶液应用于木材诱导和结构诱导方法的试剂以及受体来解决可移植性问题。将解释解释为分布式的?属性?组。代理商有没有? ?ini?既不关环境也不关他们的行动后果。他根据以下内容学习世界模型(解决方案树集)详细步骤描述,根据哪个?有特定的受体?提交,我可以预测动作吗?后果。基于搜索平台方法的代理程序调度组件:它查找操作。使用全局模型将一个环境状况链接到另一环境状况。并根据j?预测受体?提交。将所提出的方法与Q学习和自适应动态规划的方法进行了比较:提出的方法?在观察到的确定性中实现目标的机会场?使用在相同环境中学习到的世界模型的环境。DOI:http://dx.doi.org/10.5755/j01.itc.41.4.915

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号