首页> 外文期刊>電子情報通信学会技術研究報告. ニュ-ロコンピュ-ティング. Neurocomputing >強化学習とリカレントネットを用いた並列で柔軟な学習制御システムの枠組み
【24h】

強化学習とリカレントネットを用いた並列で柔軟な学習制御システムの枠組み

机译:柔性学习控制系统框架与钢筋学习和经常性网并行

获取原文
获取原文并翻译 | 示例
           

摘要

筆者らは、センサからモータ(アクチュエータ)までをニューラルネットでつなぎ、強化学習で学習することで、自律的、合目的的にさまざまな機能が並列かつ調和的に創発すると考えている。近年、強化学習とニューラルネットを用いた柔軟な学習制御システムが提案されているが、通常、学習制御部分がすべての処理を担うのではなく、柔軟な学習部とは別にフィードバック制御部などの柔軟性の低い部分が存在している。本稿では、センサからモータまでをリカレントニューラルネットで直接つなぎ、それを強化学習で学習させることで、フィードバック制御の成分を含めたさまざまな要素を並列に、かつ必要に応じて柔軟に考慮した制御を学習する能力を持つことを主張する。そして、簡単な、投げ上げ物体の捕獲問題において、リカレントネットを用いることによる文脈を考慮した行動生成とともに、一定の外力に対する適応能力、ランダムな外力に対する補償能力も学習によって獲得されることを示した。
机译:作者认为,通过将电动机(执行器)与神经网络和钢筋学习的学习连接,据信各种功能是平行和和谐组织的。近年来,已经提出了一种利用增强学习和神经网络的灵活的学习控制系统,但通常,学习控制部分对所有处理不负责任,而是与柔性学习单元的反馈控制单元等的灵活性。有一个低性别的部分。在本文中,通过用反复性神经网络直接将传感器连接到电动机,并通过加强学习学习它,包括反馈控制部件的各种元件根据需要并行和灵活地考虑。插入有能力学习。并且在简单的抛出物体捕获问题中,随着经常性网的使用,它表明对某个外力和对随机外力的补偿能力的适应性也通过学习获得。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号