首页> 外文会议>SICE Symposium on Intelligent Systems >ステップごとに報酬が周期的に変化する環境における強化学習の一考察
【24h】

ステップごとに報酬が周期的に変化する環境における強化学習の一考察

机译:定期改变环境中每一步的加强学习补偿研究

获取原文

摘要

以前著者は、回路理論におけるフェーザ表示をもちいてエピソードごとに望ましい行動を変化させる強化学習の手法を提案している。この手法は、フェーザ表示によって振幅·位相のみを扱うことで学習を可能にする手法であるが、本稿が対象とするようなステップごとに望ましい行動が変化するような対象には適用することができない。そこで本研究では、望ましい行動が一定の周期で変化する環境において、時刻に応じた行動知識を獲得できる強化学習手法を提案し、その有効性を確認する。
机译:作者提出了一种用于加强学习的技术,该技术将通过电路理论中的Phasor显示器改变每个剧集的所需行为。该方法是一种通过Phasor Display处理幅度和相位来实现学习的方法,但不能应用于目标,使得本文针对的每个步骤更改所需的行为。。因此,在本研究中,在某个期望的环境中,我们提出了一种加强学习方法,可以根据时间获取行为知识,并确认其有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号