強化学習とリカレントネットを用いた並列で柔軟な学習制御システムの枠組み

高津聡志; 後藤健太; 柴田克成

首页> 外文期刊>電子情報通信学会技術研究報告. ニュ-ロコンピュ-ティング. Neurocomputing >強化学習とリカレントネットを用いた並列で柔軟な学習制御システムの枠組み

【24h】

強化学習とリカレントネットを用いた並列で柔軟な学習制御システムの枠組み

机译：柔性学习控制系统框架与钢筋学习和经常性网并行

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

筆者らは、センサからモータ（アクチュエータ）までをニューラルネットでつなぎ、強化学習で学習することで、自律的、合目的的にさまざまな機能が並列かつ調和的に創発すると考えている。近年、強化学習とニューラルネットを用いた柔軟な学習制御システムが提案されているが、通常、学習制御部分がすべての処理を担うのではなく、柔軟な学習部とは別にフィードバック制御部などの柔軟性の低い部分が存在している。本稿では、センサからモータまでをリカレントニューラルネットで直接つなぎ、それを強化学習で学習させることで、フィードバック制御の成分を含めたさまざまな要素を並列に、かつ必要に応じて柔軟に考慮した制御を学習する能力を持つことを主張する。そして、簡単な、投げ上げ物体の捕獲問題において、リカレントネットを用いることによる文脈を考慮した行動生成とともに、一定の外力に対する適応能力、ランダムな外力に対する補償能力も学習によって獲得されることを示した。

机译：作者认为，通过将电动机（执行器）与神经网络和钢筋学习的学习连接，据信各种功能是平行和和谐组织的。近年来，已经提出了一种利用增强学习和神经网络的灵活的学习控制系统，但通常，学习控制部分对所有处理不负责任，而是与柔性学习单元的反馈控制单元等的灵活性。有一个低性别的部分。在本文中，通过用反复性神经网络直接将传感器连接到电动机，并通过加强学习学习它，包括反馈控制部件的各种元件根据需要并行和灵活地考虑。插入有能力学习。并且在简单的抛出物体捕获问题中，随着经常性网的使用，它表明对某个外力和对随机外力的补偿能力的适应性也通过学习获得。

著录项

来源
《電子情報通信学会技術研究報告. ニュ-ロコンピュ-ティング. Neurocomputing》 |2009年第461期|共6页
作者
高津聡志; 後藤健太; 柴田克成;
展开▼
作者单位

大分大学;

大分大学;

大分大学;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类人工智能理论;
关键词
リカレントニューラルネットワーク; 強化学習; フィードバック制御; フィードフォワード制御;

机译：经常性神经网络;加固学习;反馈控制;馈线前进控制;

相似文献

外文文献
中文文献
专利

1. 強化学習とリカレントネットを用いた並列で柔軟な学習制御システムの枠組み [J] . 高津　聡志, 後藤　健太, 柴田　克成電子情報通信学会技術研究報告 . 2010,第461期

机译：基于强化学习和递归网络的并行灵活学习控制系统框架
2. 強化学習とリカレントネットを用いた並列で柔軟な学習制御システムの枠組み [J] . 高津聡志, 後藤健太, 柴田克成電子情報通信学会技術研究報告. ニュ-ロコンピュ-ティング. Neurocomputing . 2009,第461期

机译：基于强化学习和递归网络的并行灵活学习控制系统框架
3. 強化学習とリカレントネットを用いた並列で柔軟な学習制御システムの枠組み [J] . 高津聡志, 後藤健太, 柴田克成電子情報通信学会技術研究報告. ニュ-ロコンピュ-ティング. Neurocomputing . 2009,第461期

机译：柔性学习控制系统框架与钢筋学习和经常性网并行
4. 組織学習と状況のクラスタリングを導入した状況変化に適応可能なマルチエージェント強化学習システム [C] . 舘山　武史システム研究会 . 2016

机译：通过引入组织学习和情境聚类可以适应不断变化的情况的多主体强化学习系统。
5. 組織業績に貢献するように従業員の知識や経験を生かす管理会計システムの利用方法のレビュー : イネーブリング?コントロールを分析枠組みとした日本企業の管理会計システムの利用方法の考察 [D] . 三浦紘嵩 2020

机译：回顾如何使用利用员工的知识和经验对组织绩效做出贡献的管理会计系统：考虑如何将日本公司的管理会计系统与支持框架作为分析框架一起使用
6. 「生活習慣病予防の取り組み」 : 21世紀の新たなストラテジーを目指して(テーマ : 「生活習慣病予防」,県立広島大学開学記念リレーシンポジウム,広島保健福祉学会第6回学術大会記録) [O] . 下方浩史 2006

机译：“努力预防与生活方式有关的疾病”：瞄准21世纪的新战略

強化学習とリカレントネットを用いた並列で柔軟な学習制御システムの枠組み

摘要

著录项

相似文献

相关主题

期刊订阅