机译:数据有效增强学习的积极探索方法
reinforcement learninginformation entropyPILCOdata efficiency;
机译:数据有效加固学习的主动探索方法
机译:通过主动学习对强化学习中的价值函数近似进行有效探索。
机译:PP-PG:将参数扰动与政策梯度方法相结合,为深加固学习中有效和高效的探索
机译:使用主动探索方法的数据有效强化学习
机译:用于医疗应用的可扩展和数据有效的深度增强学习方法
机译:积极探索对于强化间隔时间学习很重要
机译:学习中断:高效勘探的分层深度加强学习框架