首页> 外文期刊>電子情報通信学会技術研究報告 >Concurrent Q Learning における Relaxation の 改良
【24h】

Concurrent Q Learning における Relaxation の 改良

机译:并行Q学习中放松的改进

获取原文
获取原文并翻译 | 示例
           

摘要

In this study, we point out problems and suggest the modification of relaxation in CQL-e which is one of the adaptation techniques to dynamic environment in the reinforcement learning. In reinforcement learning in maze, we validate what kind of behavior conventional techniques and proposal techniques show for the change of a destination or the obstacle. Reinforcement learning; Dynamic%本研究では,強化学習における動的環境への適応手法の一つであるCQL-eにおけるrelaxationの問題点を指摘し,その改善策を提案する.迷路問題において,ゴールまたは障害物の変化に対し,従来手法と提案手法がどのような挙動を示すかを比較する.
机译:在这项研究中,我们指出了问题并提出了对CQL-e放松的修改,这是强化学习中对动态环境的适应技术之一。在迷宫强化学习中,我们验证了常规行为和提议技术是什么样的行为强化学习;动态%在本研究中,我们指出了CQL-e中的松弛问题,它是强化学习中对动态环境的适应方法之一,并对其进行了改进。在迷宫问题中,我们比较了传统方法和建议方法相对于目标或障碍物变化的行为。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号