...
首页> 外文期刊>計測自動制御学会論文集 >Actor-Criticを用いた遺伝的ネットワークプログラミングの小型移動ロボットの行動生成における性能評価
【24h】

Actor-Criticを用いた遺伝的ネットワークプログラミングの小型移動ロボットの行動生成における性能評価

机译:使用Actor-Critic进行遗传网络编程的小型移动机器人动作生成中的性能评估

获取原文
获取原文并翻译 | 示例

摘要

本論文では,強化学習の一手法であるActor-CriticをGNPに適用し(GNP with Actor-Critic, GNP-AC),入力情報を適切に判定するパラメータおよび行動決定に用いるパテメータを学習する方式を提案する.Actor-Criticは強化学習の特長である将来の報酬を予測した学習が可能であることに加え,連続値を効率的に扱える手法でありパラメータをオンラインで逐次調整できる特長があるため,適切な状況判断が可能かつプログラムの生成を効率的に行なうことが可能である.これまでのGNP-RLは,ノード遷移中に実行する判定および処理の内容を選択する手法であるが,本手法では判定および処理に使われるパラメータの生成,およびその調整を行なえるという点が異なる.さらに提案手法をKheperaロボットのコントローラに適用し,Kheperaシミュレータを用いたシミュレーションを行ないその汎化能力の評価を行なった.
机译:在本文中,我们将密集学习的一种方法Actor-Critic应用于GNP(具有Actor-Critic的GNP,GNP-AC),并学习一种方法,以学习用于适当判断用于确定动作的输入信息和推杆的参数。建议。除了能够预测未来的奖励(这是增强学习的功能)之外,Actor-Critic是一种可以有效处理连续值并具有可以在线顺序调整参数的功能的方法,因此这是一种合适的情况。可以做出判断并有效地生成程序。传统的GNP-RL是选择在节点转换期间要执行的判断和处理的内容的方法,但是该方法的不同之处在于可以生成和调整用于判断和处理的参数。 ..此外,将所提出的方法应用于Kepera机器人的控制器,并使用Kepera仿真器进行了仿真以评估其泛化能力。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号