机译:使用基于价值梯度的策略进行实时运动控制的无学习率强化学习
Reinforcement learning; Process model; Robotics; Local linear regression; Least squares temporal difference;
机译:使用基于价值梯度的策略进行实时运动控制的无学习率强化学习
机译:“主动”学习模型:利用基于联合学习的主动脑概念进行无模型和基于模型的强化学习的集成框架
机译:基于强化学习的变速限制控制策略,可减少高速公路经常性瓶颈时的交通拥堵
机译:两机一缓冲生产系统中两种基于强化学习的实时控制策略的比较研究
机译:基于无模型强化学习方法的PI控制器的动态调整。
机译:基于强化学习的混合动力电动汽车实时能源管理策略的实现与仿真验证
机译:RTMBA:基于实时模型的机器人控制强化学习架构