首页> 外文期刊>電子情報通信学会技術研究報告 >自由エネルギーを用いた強化学習による状態のタスク依存な集団符号化
【24h】

自由エネルギーを用いた強化学習による状態のタスク依存な集団符号化

机译:利用自由能进行强化学习的国家任务相关集体编码

获取原文
获取原文并翻译 | 示例
       

摘要

本研究では,状態数が大きいマルコフ決定過程(MDP)問題を扱うことができる自由エネルギーを用いた強化学習手法をdigit floorタスクという部分観測マルコフ決定過程(POMDP)問題に適用することにより,状態がネットワーク中の隠れ層の発火パターンに,報酬に依存した形で集団符号化されることを示す.また,このタスク依存な集団符号化が,入力ノイズや隠れ層のサイズの変化に対してロバストであることも示す.%The properties of free-energy-based reinforcement learning were investigated using a POMDP task called the digit floor task. The simulation results showed that the reward-dependent representation of latent states was obtained in distributed activation patterns of hidden units. These representations were robust in the face of high observation noise and the varied number of hidden units.
机译:在这项研究中,我们将可以处理大量状态的马尔可夫决策过程(MDP)问题的,使用自由能的强化学习方法应用于部分可观察到的马尔可夫决策过程(POMDP)问题,称为数字发言权任务。我们表明,网络中隐藏层的触发模式以依赖于奖励的方式共同编码。我们还表明,这种与任务相关的集体编码对于输入噪声和隐藏层大小的变化具有鲁棒性。基于POMDP任务(指楼任务),研究了基于自由能的强化学习的性质。仿真结果表明,潜伏状态的奖励依赖表示形式是在隐藏单元的分布式激活模式下获得的,这些表示形式很健壮面对高观测噪声和隐藏单元数量的变化。

著录项

  • 来源
    《電子情報通信学会技術研究報告》 |2008年第101期|p.91-96|共6页
  • 作者单位

    沖縄大学院大学先行研究プロジェクト 〒904-2234沖縄県うるま市州崎12-22,奈良先端科学技術大学院大学 〒630-0192奈良県生駒市高山町8916-5;

    沖縄大学院大学先行研究プロジェクト 〒904-2234沖縄県うるま市州崎12-22,奈良先端科学技術大学院大学 〒630-0192奈良県生駒市高山町8916-5;

    沖縄大学院大学先行研究プロジェクト 〒904-2234沖縄県うるま市州崎12-22,奈良先端科学技術大学院大学 〒630-0192奈良県生駒市高山町8916-5;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 jpn
  • 中图分类
  • 关键词

    強化学習; 状態表現; 集団符号化; 自由エネルギー; product of experts;

    机译:强化学习;状态表示;集体编码;自由能;专家产品;
  • 入库时间 2022-08-18 00:37:26

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号