School of Computer Science and Engineering The University of New South Wales Sydney 2052 Australia;
School of Computer Science and Engineering The University of New South Wales Sydney 2052 Australia;
机译:强化学习的时差算法的生物学实现:对O'Reilly等人的理论评论。 (2007年)
机译:尽管没有实际的学习差异,但在相对较好和相对较差的试验得到反馈后,对学习的判断要高得多
机译:截断时间差异:关于强化学习的TD(lambda)的有效实施
机译:分布式混合卡尔曼加固学习的时间差异
机译:朋友与交往的陌生人世界中的社交学习:具有实验证据的理论模型
机译:PNAS Plus:在经验性货币涌现范例中对比时差和机会成本强化学习
机译:加强学习脑机接口的熵核时间差异