首页> 外文会议>情報処理学会;情報処理学会全国大会 >自己組織化特徴マップに基づいた時系列パターンのための確率的連想メモリによる強化学習を用いたロボットの行動学習
【24h】

自己組織化特徴マップに基づいた時系列パターンのための確率的連想メモリによる強化学習を用いたロボットの行動学習

机译:使用基于随机组织可寻址内容的时间序列增强模式的随机学习可增强学习的机器人行为学习

获取原文

摘要

部分観測マルコフ決定過程(POMDPs : PartiallyObservable Markov Decision Processes) 環境においても決定的な政策を学習することのできる手法として,POMDPs 環境のための決定的政策を学習するProtSharing[1] が提案されている.この手法では,過去の観測の系列を用いることで,同じ観測に対して複数の行動をとる必要がある場合にも適切な行動を選択することができる.また,ニューラルネットワークを用いた強化学習に関する様々な研究も行われており,そのような手法のひとつとして自己組織化マップに基づいた時系列パターンのための確率的連想メモリによる強化学習[2] が提案されている.
机译:部分天文台马尔可夫决策过程(POMDP:部分 可观察的马尔可夫决策过程)的气味 但是作为学习决定性政策的一种方式 POMDPs Prot学习有关环境的决定性政策 提出了共享[1]。用这种方法,过去 通过使用一系列观测值,对于同一观测值的多个观测值 需要采取行动时选择正确的行动 能够。另外,使用神经网络 关于强化学习的各种研究也已经进行。 基于自组织图作为此类方法之一 具有较强的随机关联记忆能力,可用于时间序列模式 化学学习[2]已经被提出。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号