首页> 外文会议>情報処理学会全国大会 >変化する環境に対するステップサイズパラメータオンライン調整法
【24h】

変化する環境に対するステップサイズパラメータオンライン調整法

机译:在线调整步长参数以适应不断变化的环境

获取原文

摘要

本稿では、徐々に変化する環境の中で、エージェントが学習を継続しながら環境の変化に適応していくという前提のもと、学習パラメータであるステップサイズαと環境から得られる観測データの関係を明らかにした。その結果を元に、αを環境の変化に追随させる方法として再帰的指数平滑移動平均によるステツプサィズ勾配降下法(RASP)を提案した。この方法の特徴は、通常の勾配降下法と異なり、高階の導関数をシステマティックに求めることができる点である。このため、勾配法によるαの変更量を比較^)大きく取ることができ、さらに、修正の際に利用する値も同時に修正する方法を提供できる。
机译:在本文中,我们讨论了学习参数步长α和从环境中获得的观测数据之间的关系,前提是在不断变化的环境中继续学习的前提下,主体要适应环境的变化。根据结果​​,我们提出了使用递归指数平滑移动平均值的步长梯度下降(RASP)方法作为使α随环境变化而变化的方法。该方法的特点是,与普通的梯度下降法不同,可以系统地获得高阶导数。因此,可以通过梯度法()来比较α的变化量,并且进一步,可以提供一种同时校正在校正时使用的值的方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号