首页> 外文期刊>電子情報通信学会技術研究報告. ニュ-ロコンピュ-ティング. Neurocomputing >選択的不感化ニューラルネットを用いた強化学習の効率化
【24h】

選択的不感化ニューラルネットを用いた強化学習の効率化

机译:使用选择性狩猎神经网络升高钢筋学习的效率提高

获取原文
获取原文并翻译 | 示例
获取外文期刊封面目录资料

摘要

強化学習は,状態空間が広いと学習に非常に時間がかかるという深刻な問題を抱えているが,その最大の原因は価値関数を効率的に近似する方法がないことにある.本報告では,選択的不感化ニューラルネットを用いて関数近似器を構成することによってこの問題の解決を図る.本手法を4次元の連続状態空間をもつ台車型倒立振子の安定化制御に適用したところ,学習効率が大幅に向上すると共に制御の安定性も向上することがわかった.このことは,構成した関数近似器が高い汎化能力をもつと共に分解能の点でも優れていることを示している.
机译:增强学习具有严重的问题,即国家空间很大,并且有一个严重的问题,即学习需要很长时间,但其最大原因是没有有效地近似值近似值函数。 在本报告中,我们将通过使用选择性狩猎神经网络配置功能杂机来解决这个问题。 已经发现,将具有四维连续状态空间的卡车块的方法应用于倒立摆的稳定控制,并且发现学习效率显着提高,并且还改善了控制稳定性。 这表明配置的功能近似具有高泛化能力,并且在分辨率中也是出色的。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号