Reinforcement learning; Training; Legged locomotion; Approximation algorithms; Classification algorithms; Task analysis; Function approximation;
机译:具有多种深度确定性政策梯度算法的深度集成钢筋学习
机译:四足足球机器人的策略梯度学习
机译:一种基于混合行走机器人混合行走步态的步态过渡算法
机译:基于深度确定性政策梯度算法的机器人群合作交通任务的集体行为
机译:机器人中的四桥情绪高速公路
机译:基于并行综合学习粒子群优化化算法的人形机器人步态优化方法
机译:基于视觉的机器人掌握的合奏自动启动深度确定性政策梯度