机译:交叉熵法线性函数逼近的强化学习在线预测算法
机译:具有函数逼近的强化学习算法:最新进展和应用
机译:基于在线强化学习算法的一类非线性MIMO离散时间系统的容错控制器设计
机译:在线并发强化学习算法,用于求解部分未知的非线性连续时间系统的两人零和游戏
机译:线性函数近似加强学习算法的最优性
机译:延迟敏感无线通信中增强学习的价值函数近似算法
机译:MEME:大型机器学习中有效近似的准确最大熵方法
机译:Hilbert空间中的无约束在线线性学习:minimax 算法和正态近似