机译:基于同时扰动随机逼近的参数学习的新型高效局部协调高速公路匝道计量策略
机译:使用Dyna和策略逼近在连续状态和动作空间中进行有效的强化学习
机译:通过使用连续动作的基于接受域的函数逼近方法,通过强化学习来学习达到
机译:闭环最佳高速公路斜坡计量使用连续状态空间加固学习功能近似
机译:用于高速公路匝道计量的强化学习最佳自适应控制策略。
机译:通过使用连续动作的基于受体场的函数逼近方法通过强化学习来学习达到
机译:通过使用连续动作的基于受体场的函数逼近方法,通过强化学习来学习达到
机译:模式识别在高速公路匝道计量拥挤条件预测中的应用。第2卷(高速公路和坡道实时预报)