Case Western Reserve University.;
机译:加固学习与规则的自适应交通信号控制:交通信号控制的傅立叶基线函数近似
机译:内插增长神经气体的强化学习中的自适应函数逼近
机译:在非政策强化学习中用于价值函数逼近的自适应重要性抽样。
机译:基于人工烃网络的分层加固学习中的基于价值函数逼近
机译:基于对象的环境中有效值函数逼近的分层功能类别学习
机译:通过使用连续动作的基于受体场的函数逼近方法通过强化学习来学习达到
机译:多智能体强化学习的自适应模糊函数逼近