首页> 外文会议>情報処理学会;情報処理学会全国大会 >段階的にサブゴールを獲得するStepwise Unified Hierarchical Reinforcement Learningの提案
【24h】

段階的にサブゴールを獲得するStepwise Unified Hierarchical Reinforcement Learningの提案

机译:逐步的子目标的逐步统一的分层强化学习建议

获取原文

摘要

強化学習とは,エージェントが,観測可能な環境に対する適切な行動系列を確率的に学習する機械学習手法の1つである.エージェントは,設計者が環境に設定した報酬を元に,それを最大にするような行動を選択するように学習する.そのため,試行錯誤的に望ましい行動系列を学習できるが,長期的な戦略を必要とする行動系列の学習は困難であることが知られている.
机译:强化学习是代理可以观察的环境。 一种机器学习方法,可以概率地学习适当的行为顺序 这是其中之一。代理由设计者在环境中设置 根据奖励选择使之最大化的动作 像这样学习。因此,期望的行为是通过反复试验得出的 可以学习序列但需要长期策略的行为系统 众所周知,列学习是困难的。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号