...
机译:基于自适应奖励成形机制的梯度下降SARSA(λ)算法
Department of Computer Science and Technology, Soochow University, Suzhou, China;
Department of Computer Science and Technology, Soochow University, Suzhou, China;
Department of Computer Science and Technology, Soochow University, Suzhou, China;
Department of Computer Science and Technology, Soochow University, Suzhou, China;
reinforcement learning; Sarsa (λ); gradient descent; reward-shaping; adaptive;
机译:使用梯度自适应步长的非线性自适应滤波器的归一化梯度下降算法
机译:基于模态算法的自适应梯度下降基于局部搜索的最优控制器设计
机译:使用自适应步骤梯度下降算法的四元数基于AHRS的Kalman滤波器
机译:基于自适应随机梯度下降(ASGD)的优化算法的CEST MRI系列运动校正
机译:基于勘探和开发机制的自适应萤火虫算法全局优化
机译:使用基于SARSA(λ)的边界修正与增强的梯度下降曲线拟合拟合对神经元结构进行分割
机译:基于saRsa(λ)的边界修正与增强梯度下降曲线形状拟合的神经元结构分割。
机译:基于梯度搜索的自适应IIR算法