Calculus; Reinforcement Learning; Unification;
机译:建模人脑中的错误检测:强化学习和冲突监控理论的初步统一
机译:截断时间差异:关于强化学习的TD(lambda)的有效实施
机译:广泛形式游戏中的强化学习过程
机译:广泛统一的兰姆达微积分和加强学习
机译:一种新的范式,用于分析自由飞行的蜜蜂(Apis mellifera)的大量后期强化或社交强化延迟
机译:Banach空间中变量的计算统一和单调非线性算子理论。
机译:在确定性Lambda演算LR中使用letrec,case,构造函数,seq和变量链通过统一计算重叠
机译:启动au Lambda-Calcul(启动为Lambda微积分)。