exploring visit; forgetting factor; option; prior information; reinforcement learning;
机译:借助不完整的先验信息加速强化学习
机译:通过控制使用作为先验信息给出的选项来加速强化学习
机译:强化学习算法的融合和学习加速。没有。 026706
机译:利用先验信息促进强化学习的研究
机译:具有广义先验的基于模型的贝叶斯强化学习
机译:使用深度加强学习优化脚跖压力压力中心的传感器放置
机译:学习可转让的域名前脚,以便在加固学习中安全探索