Reinforcement Learning; Markov decision processes; Neural networks; Representation learning; Goal-directed Reinforcement Learning;
机译:基于路径 - 积分的蛇形机器人目标机动的加强学习算法
机译:钢筋学习期间刺激加工的目标导向和习惯调制
机译:从习惯的生物到目标导向的学习者:跟踪基于模型的强化学习的发展
机译:CostNet:用于目标导向的强化学习的端到端框架
机译:医学终端到底机学习框架:数据归档,模型解释和合成数据生成
机译:强化学习过程中刺激处理的目标定向和习惯性调制
机译:针对对话状态跟踪和管理的端到端学习 使用深度强化学习