首页> 外文期刊>計測自動制御学会論文集 >Actor-Criticを用いた遺伝的ネットワークプログラミングの小型移動ロボットの行動生成における性能評価
【24h】

Actor-Criticを用いた遺伝的ネットワークプログラミングの小型移動ロボットの行動生成における性能評価

机译:遗传网络编程小型移动机器人行为生成的绩效评估 - 评论家

获取原文
获取原文并翻译 | 示例
获取外文期刊封面目录资料

摘要

本論文では,強化学習の一手法であるActor-CriticをGNPに適用し(GNP with Actor-Critic, GNP-AC),入力情報を適切に判定するパラメータおよび行動決定に用いるパテメータを学習する方式を提案する.Actor-Criticは強化学習の特長である将来の報酬を予測した学習が可能であることに加え,連続値を効率的に扱える手法でありパラメータをオンラインで逐次調整できる特長があるため,適切な状況判断が可能かつプログラムの生成を効率的に行なうことが可能である.これまでのGNP-RLは,ノード遷移中に実行する判定および処理の内容を選択する手法であるが,本手法では判定および処理に使われるパラメータの生成,およびその調整を行なえるという点が異なる.さらに提案手法をKheperaロボットのコントローラに適用し,Kheperaシミュレータを用いたシミュレーションを行ないその汎化能力の評価を行なった.
机译:在本文中,我们应用了演员 - 评论家,这是一种加强GNP学习的方法(GNP与演员 - 评论家,GNP-AC),一种学习用于正确确定输入信息的课程仪表和用于的模式仪表行动决定。建议。演员 - 评论家是一种可以有效处理连续值的方法,可以调整连续值,作为可以有效处理连续值的方法,并且可以在线调整参数。可以确定和有效地生成程序。先前的GNP-RL是选择在节点转换期间要执行的确定和处理内容的方法,但在此方法中,它可以生成用于确定和处理的参数,并调整它。此外,将所提出的方法应用于Khepera机器人控制器,并进行使用Khepera模拟器的模拟以评估其泛化能力。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号