control engineering computing; gradient methods; learning (artificial intelligence); road traffic control; road vehicles; traffic engineering computing;
机译:基于双延迟深度确定性政策梯度算法的自适应神经模糊PID控制器
机译:异步epiSodic深度确定性政策梯度:在计算复杂环境中连续控制
机译:通过深度确定性政策梯度与后敏感体验重放的持续共享控制掌握任务
机译:基于深度确定性政策梯度算法的自动巷改变行为连续控制
机译:人机界面开发,用于在手动,自动和共享控制自动驾驶中修改驾驶员车道变更行为。
机译:控制动态双足行走的深度确定性策略梯度的实现
机译:考虑使用深度确定性政策梯度算法考虑驾驶风格的端到端自动化车道改变机动