首页> 外文会议>インテリジェント·システム·シンポジウム >強化学習におけるQテーブルの最大固有値を用いた空間分割方法の変更タイミングの決定
【24h】

強化学習におけるQテーブルの最大固有値を用いた空間分割方法の変更タイミングの決定

机译:Q桌中Q桌中最大特征率的空间分裂方法变化定时

获取原文

摘要

強化学習の代表的な手法であるQ 学習では,連続状態空間や連続行動空間を扱う際,空間の離散化を行う必要がある.本研究では,より適した離散化を行うために,空間分割方法を学習の進度に応じて変更させた.また,その変更タイミングを手動で設定するのではなく,自動的に適切な変更タイミングを定めるために,Q テーブルの最大固有値を求めて指標とする手法を提案し,考察を行った.
机译:在Q学习中,这是一种增强学习的代表性方法,在处理连续的状态空间和连续行为空间时需要离散空间。在这项研究中,根据学习的进展改变了空间分割方法,以执行更合适的离散化。另外,不是手动设置改变定时,以便自动地定义适当的改变定时,提出了一种方法,并讨论为索引来确定Q表的最大eIGEN值。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号