机译:优先考虑基于启发式动态编程的学习系统的有用经验重播
South Dakota State Univ Elect Engn & Comp Sci Dept Brookings SD 57007 USA;
Univ North Texas Elect Engn Dept Denton TX 76203 USA;
Adaptive dynamic programming (ADP); experience replay (ER); heuristic dynamic programming (HDP); intelligent system; neural networks (NNs); online learning-based controller; prioritized sampling;
机译:基于机启发式动态编程的离散时间受扰动的多助理系统的学习控制
机译:基于深度Q学习,经验回放和启发式知识的智能机器人路径规划
机译:基于Deep Q-Learning的经验重播和启发式知识的智能机器人路径规划
机译:高价值优先体验重播,用于非政策强化学习
机译:探索性研究生活经验和混合步骤家庭的贡献因素---动态系统和变革性学习理论方法。
机译:睡眠开始时视觉运动学习的认知重现:时间动态及其与任务绩效的关系
机译:优先考虑在大鼠海马学习的经验重放
机译:增强深度强化学习的体验重播。