首页> 外文期刊>電子情報通信学会技術研究報告. ニュ-ロコンピュ-ティング. Neurocomputing >動的環境下の強化学習アルゴリズム:SequentialMonteCarloとサンプル初期化
【24h】

動的環境下の強化学習アルゴリズム:SequentialMonteCarloとサンプル初期化

机译:動的環境下の強化学習アルゴリズム:SequentialMonteCarloとサンプル初期化

获取原文
获取原文并翻译 | 示例
       

摘要

強化学習の枠組みはエージェントと環境から成っており、行動、状態、報酬の3つの変数による相互作用によってエージェントの学習が行われる0これまで報告されているアルゴリズムの多くは静的な環境を前提としているため、環境が激変する場合、学習に支障をきたす事がままある。 それは例えば学習が非常に遅くなる、もしくは学習自体が破綻してしまう、等である。 本論文では、エ岬ジェントが環境変化に対応可能な機構を持つ手法の提案を行う。 強化学習をベイズ的枠組みから定式化し、サンプ)L/を初桐化(再採取 ─工胄陇郡圣ⅴ毳触辚亥啶騻浃à縎equentialMonteCarlo(SMC)で実装する。 このアルゴリズムを動的環境を含む強化学習問題に適用し、その有効性を示す。

著录项

获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号