机译:使用CPG控制器的Biped步行的非政策自然政策梯度方法
reinforcement learning; off-policy learning; biped walking; central pattern generator (CPG); human modeling in robotics;
机译:使用CPG控制器的Biped步行的非政策自然政策梯度方法
机译:使用策略梯度方法学习基于CPG的Biped运动
机译:通过使用策略梯度学习动态策略:在Biped步行中的应用
机译:基于禁止政策自然演员的不稳定双层机器人,快速稳定地学习准无源动力行走
机译:基于CPG的分散反馈控制器进行自然模式跟踪。
机译:控制动态双足行走的深度确定性策略梯度的实现
机译:使用策略梯度方法学习基于CPG的Biped Locomotion:应用于人形机器人