Research School of Information Sciences and Engineering Australian National University Canberra ACT 0200, AUSTRALIA;
机译:基于两步梯度的水下机器人行为学习强化学习
机译:结合基于梯度的方法和多目标强力学习的演化策略
机译:基于政策梯度的深度加固学习的自主水下车辆的茂盛运动规划系统
机译:基于直接的基于梯度的强化学习,用于机器人行为学习
机译:延迟敏感无线通信中增强学习的价值函数近似算法
机译:通过使用连续动作的基于受体场的函数逼近方法通过强化学习来学习达到
机译:基于梯度的强化学习的估计和近似界