机译:自主车辆可以在未来的城市实现可持续的移动性吗? 不同城市交通选择的用户偏好的见解与政策挑战
机译:通过逆向强化学习和贝叶斯政策改进,结合非最佳演示和反馈中的学习
机译:家居机器人的服务技能改进:基于强化学习的自主代动作序列
机译:通过使用国家无关的选项策略蚂蚁终止改进来加速自主学习
机译:加快 轨迹规划 自主机器人 工作 在复杂的环境
机译:基于政策梯度和演员批评的国家代表性学习自主车辆安全驾驶
机译:教师能力的在职改进:政策选择及其对泰国教学的影响
机译:税收政策:加速退税和降低国税局利息成本的选择