机译:整合时差方法和自组织神经网络用于延迟评估反馈的强化学习
Reinforcement learning; self-organizing neural networks (NNs); temporal difference (TD) methods;
机译:整合领域知识和强化学习的自组织神经网络
机译:基于时间编码和STDP的尖峰神经网络加固学习方法
机译:基于深度神经网络和转移加固学习集成的建筑能耗预测方法
机译:将自组织神经网络与动机学习相结合,以进行多阶段随机博弈的协同多主体强化学习
机译:具有延迟反馈的神经网络中的多重稳定性:理论与应用。
机译:从延迟反馈中学习:时间信用分配中的神经响应
机译:时间差分方法与自组织神经网络相结合,用于延迟评价反馈的强化学习
机译:通过强化和注意反馈对神经网络中联想学习的预测调节