机译:在线学习改进的N步值梯度学习自适应动态规划算法
Missouri Univ Sci & Technol ACIL Rolla MO 65401 USA|Basra Oil Co Basra 61030 Iraq;
Missouri Univ Sci & Technol Dept Elect & Comp Engn ACIL Rolla MO 65401 USA;
Adaptive dynamic programming (ADP); convergence analysis; eligibility traces; online learning; reinforcement learning; temporal difference (TD); value gradient learning (VGL);
机译:随机梯度算法自适应逆加固学习的Langevin动态
机译:基于RLS学习在线DLQR最优控制的动态启发式动态规划算法的收敛性和数值稳定性
机译:基于神经网络的学习算法,通过自适应动态规划,用于具有控制约束的离散多人系统的合作游戏
机译:基于投影梯度时差和高级启发式动态规划的在线学习控制
机译:动态和自适应在线学习的理论和算法。
机译:通过动力学和机器学习算法的仿真来改进对毒品诱发的尖锐湿疣的预测
机译:通过分布式近端梯度算法在线学习动态图