Learning (artificial intelligence); Heuristic algorithms; Standards; Markov processes; Dynamics; Benchmark testing; Prediction algorithms;
机译:基于深度Q学习,经验回放和启发式知识的智能机器人路径规划
机译:基于Deep Q-Learning的经验重播和启发式知识的智能机器人路径规划
机译:基于重放的输出反馈Q学习方案,用于离散线性系统的最佳输出跟踪控制
机译:Q-Learning在动态环境中有经验重播
机译:CheckPoint Hindsight体验重播,直观地在奖励稀疏环境中应用域知识
机译:双层Q-Learning和更快的R-CNN自主车辆导航和动态环境中的避难
机译:启发式Q-Leature基于经验重播,无人驾驶空中车辆的三维路径规划
机译:重播技术:概念,初步经验和经验以及拟议的发展