Training; Backtracking; Machine learning algorithms; Databases; Heuristic algorithms; Neural networks; Linear programming;
机译:具有恒定步长的时差学习算法的渐近分析
机译:策略中带有模糊控制器的策略梯度强化学习算法
机译:动态遗憾收敛分析与对政策机器人模仿学习的自适应正规化算法
机译:一种改进的基于Broyden-Fletcher-Goldfarb-Shanno(BFGS)方法的改进的学习算法回到传播神经网络的方法
机译:十六进制值与策略函数学习算法的研究
机译:基于信赖域二次模型的大型非线性方程组有限内存BFGS算法
机译:增量策略学习:具有共同兴趣的强化学习代理的均衡选择算法
机译:矩阵平衡算法及其在有限记忆拟牛顿法中的应用