...
首页> 外文期刊>電子情報通信学会技術研究報告. ニュ-ロコンピュ-ティング. Neurocomputing >選択的不感化ニューラルネットを用いた強化学習の効率化
【24h】

選択的不感化ニューラルネットを用いた強化学習の効率化

机译:使用选择性脱敏神经网络的有效强化学习

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

強化学習は,状態空間が広いと学習に非常に時間がかかるという深刻な問題を抱えているが,その最大の原因は価値関数を効率的に近似する方法がないことにある.本報告では,選択的不感化ニューラルネットを用いて関数近似器を構成することによってこの問題の解決を図る.本手法を4次元の連続状態空間をもつ台車型倒立振子の安定化制御に適用したところ,学習効率が大幅に向上すると共に制御の安定性も向上することがわかった.このことは,構成した関数近似器が高い汎化能力をもつと共に分解能の点でも優れていることを示している.
机译:强化学习存在一个严重的问题,即在状态空间较宽时需要花费很长时间来学习,但是最大的原因是没有一种方法可以有效地逼近值函数。在本报告中,我们尝试通过使用选择性脱敏神经网络构造函数逼近器来解决此问题。当将该方法应用于具有4维连续状态空间的小车型倒立摆的稳定控制时,发现学习效率显着提高并且控制稳定性也得到了提高。这表明构造的函数逼近器具有高泛化能力,并且在分辨率方面也极好。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号