首页> 外文期刊>日本ロボット学会誌 >GAにより探索空間の動的生成を行うQ学習による実多自由度ロボットの制御:階層構造の拡張と蛇型ロボットへの適用
【24h】

GAにより探索空間の動的生成を行うQ学習による実多自由度ロボットの制御:階層構造の拡張と蛇型ロボットへの適用

机译:通过Q学习控制真正的多自由度机器人,并通过GA动态生成搜索空间:层次结构的扩展及其在蛇形机器人中的应用

获取原文
获取原文并翻译 | 示例
           

摘要

近年,強化学習がロボットの行動獲得法として注目されている。 強化学習は学習に際し予備知識を必要とせず,高い環境適応性を持つ学習法である.しかし,学習速度や行動·状態空間の大きさなどの問題により,複雑な実ロボットへの適用は困難であり,多自由度を有するロボットへの適用例は少ない。 強化学習の代表例であるQ学習は,最適性に関する理論的枠雑みを持ち,小規模な問題に対しては非常に有効であるが,多自由度ロボットなどの大規模な問題においては,行動·状態空間の増加が学習を困難にしてしまい,事実上適用不可能である.分類子システムは,GAによりルールを生成するため,探索空間が広いタスクに対して学習を試みることは可能であるが,条件部が示す状態の集合と,行動部によって遷移可能な状態の集合との整合を取ることが難しく,多自由度ロボットなど,探索空間の大きなシステムに対する有効な政策の獲得は困難であると考えられる.また,"don't care"は対象を部分観測としてしまうという問題を持つこと,さらに,汎用的なルールと特殊なルールの共存が困難であることなどが指摘されている。 このような問題をふまえ,我々は,Q-learning with Dynamic Structuring of Exploration Space Based on Genetic Algorithm(QDSEGA)を提案してきた.QDSEGAは,多くの自由度を有する冗長ロボットに対七て設計されたものであり,冗長自由度により実現される冗長な運動の中からタスクの達成に必要な動きを自律泊勺に抜き出し,これらを組み合わせることによってタスクを達成することができる.文献では,50リンクを有する多自由度マニピュレータの障害物回避問題を例に,大規模な探索空間を持つ対象に対する適用可能性,環境変化に対する頑強性など,その有用性が示されている.また,文献では,12本の足を持つ多足ロボットを例に,最適な歩行運動の獲得が可能であることが示されている.しかし,上述の文献では,QDSEGAによる階層構造において,十分な能力を持った低層を仮定しており,適用可能なロボットのクラスを制限した場合での有効性の検討にとどまっている.
机译:近年来,强化学习作为获取机器人动作的方法已引起关注。强化学习是一种不需要先验知识并且具有高度环境适应性的学习方法。然而,由于诸如学习速度和动作/状态空间的大小之类的问题,难以将其应用于复杂的真实机器人,并且很少有应用于具有多个自由度的机器人的示例。 Q学习是强化学习的典型示例,它具有最优性的理论框架,对小规模问题非常有效,但对多自由度机器人等大型问题非常有效。行为/状态空间的增加使学习变得困难,并且实际上是不适用的。由于分类器系统通过GA生成规则,因此可以尝试搜索具有较宽搜索空间的任务,但是存在由条件部分指示的一组状态和可以由操作部分转换的一组状态。对于具有较大搜索空间的系统(例如多自由度机器人),很难获得有效的策略。另外,已经指出“无关”存在目标是部分观察并且通用规则和特殊规则难以共存的问题。针对这些问题,我们提出了一种基于遗传算法(QDSEGA)的动态探索空间结构Q学习方法。 QDSEGA是为具有许多自由度的冗余机器人设计的,完成任务所需的动作是从自主宫殿中的冗余度实现的冗余动作中提取的。可以通过组合完成任务。在文献中,以具有50个链接的多自由度机械手的避障问题为例,并显示了其有用性,例如适用于具有较大搜索空间的对象以及对环境变化的鲁棒性。另外,文献表明,以12条腿的多腿机器人为例,可以获得最佳的步行运动。然而,在上述文献中,在QDSEGA的分层结构中,假设具有足够能力的低层,并且仅当限制了适用的机器人类别时才检查有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号