Path planning; Reinforcement learning; Intelligent vehicles; Accidents; Roads; Continuous time systems;
机译:光突发交换网络中路径选择和波长选择的强化学习框架
机译:基于动作选择概率的动态强化函数强化学习方法
机译:基于障碍区域扩展策略的加固学习路径规划算法
机译:基于加强学习策略的长度优先级的最佳路径选择的新方法
机译:通过有条件的信号优先权控制过境时速:使用强化学习的基于微仿真的方法(安大略省)。
机译:基于波长变量选择和机器学习方法的UAV图像高光谱数据叶区域指标估计模型
机译:识别敌人:使用基于案例的推理将强化学习与策略选择相结合