...
首页> 外文期刊>電子情報通信学会技術研究報告. ニュ-ロコンピュ-ティング. Neurocomputing >強化学習エージェントの方策情報ベクトル表現を用いた学習効率化に関する研究
【24h】

強化学習エージェントの方策情報ベクトル表現を用いた学習効率化に関する研究

机译:强化学习主体策略基于信息向量表示的学习效率研究

获取原文
获取原文并翻译 | 示例

摘要

本研究では,動的環境における強化学習の効率化を目的とした手法を提案する.先行研究の多くは,手法の実装や計算にかかるコストが大きかったり,環境変化への適応に多大な試行数が必要になるといった問題点があった.提案手法では,方策学習の過程で得られる情報を多次元ベクトル表記した上で,単純な演算処理によって環境変化の有無を試行毎に判断することで既得方策の補正を実現する.また,計算機実験により提案手法の特性を評価する.
机译:在这项研究中,我们提出了一种旨在提高动态环境中增强学习效率的方法。先前的许多研究都存在诸如实施和计算该方法的高成本以及适应环境变化所需的大量试验之类的问题。在所提出的方法中,在策略学习过程中获得的信息以多维向量表示,并且通过简单的算术处理对每个试验判断环境变化的存在与否,以实现对所获取策略的校正。另外,通过计算机实验评估了所提出方法的特性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号