Bicycles; Trajectory; Robots; Learning (artificial intelligence); Aerospace electronics; Process control; Computer architecture;
机译:基于双延迟深度确定性政策梯度算法的自适应神经模糊PID控制器
机译:具有多种深度确定性政策梯度算法的深度集成钢筋学习
机译:由修改的深度确定性政策梯度控制后的AUV路径
机译:使用深度确定性政策梯度算法控制自行车
机译:具有非微分约束和一般边界条件的最优控制问题的梯度恢复算法比较
机译:控制动态双足行走的深度确定性策略梯度的实现
机译:基于自动驾驶卷积块注意力的深度确定性政策梯度算法