Biped; Reflexive controller; Policy searching;
机译:利用传感器驱动的神经元控制器和实时在线学习进行快速两足动物步行
机译:使用CPG控制器的Biped步行的非政策自然政策梯度方法
机译:通过使用策略梯度学习动态策略:在Biped步行中的应用
机译:快速搭配,具有反射神经元控制器和政策梯度加固学习
机译:使用强化学习的两足动物动态步行
机译:在神经元控制和学习下的两足动物机器人中的自适应快速行走
机译:通过不断演变的政策参数化进行强化学习,最大限度地减少步行能量