Roads; Task analysis; Reinforcement learning; Vehicles; Decision making; Supply and demand;
机译:自适应交通信号控制:探索奖励定义以进行强化学习
机译:高斯过程回归深增强学习的奖励功能预测
机译:加固学习与规则的自适应交通信号控制:交通信号控制的傅立叶基线函数近似
机译:在真实世界限制下,评估加强学习交通信号控制的奖励职能
机译:机器人任务规划加速奖励功能技术的深增强学习
机译:学习的头记忆的尾巴:奖励强化和多巴胺在确定跨多个时间尺度的行为相关性中的作用
机译:一种使用基于异构顾问的多功能钢筋学习的动态流量分配的分布式分配方法