...
机译:截断时间差异:关于强化学习的TD(lambda)的有效实施
机译:强化学习的时差算法的生物学实现:对O'Reilly等人的理论评论。 (2007年)
机译:渐近时间差异学习:具有多项式样本复杂度的稳定强化学习
机译:近端梯度时间差异学习:具有多项式样本复杂性的稳定增强学习
机译:快速高效的加强学习,截断的时间差异
机译:使用有限差分时域法求解麦克斯韦方程组的高效网格截断技术。
机译:SSCC TD:用于时间差异学习的串行和同时配置提示复合刺激表示。
机译:截断的时间差异:关于加强学习的TD(Lambda)的有效实施