退出
我的积分:
中文文献批量获取
外文文献批量获取
机译:梯度Q(σ,λ):一种统一算法,具有钢筋学习中的功能近似
Long Yang; Yu Zhang; Qian Zheng; Gang Pan;
机译:强化学习中价值函数逼近的受限梯度下降算法
机译:基于价值函数的强化学习算法的统一分析
机译:延迟敏感无线通信中增强学习的价值函数近似算法
机译:通过使用连续动作的基于受体场的函数逼近方法通过强化学习来学习达到
机译:功能近似设备,强化学习系统,功能近似系统和功能近似程序
机译:功能近似装置,增强的学习系统,功能近似系统和功能近似程序
机译:用于加固学习系统的培训返回功能的Meta-梯度更新
抱歉,该期刊暂不可订阅,敬请期待!
目前支持订阅全部北京大学中文核心(2020)期刊目录。