退出
我的积分:
中文文献批量获取
外文文献批量获取
第一个书签之前
季挺;
南昌大学;
参数化; 值函数逼近;
机译:在非政策强化学习中用于价值函数逼近的自适应重要性抽样。
机译:基于聚类的图拉普拉斯框架,用于强化学习中的价值函数逼近
机译:基于选择性脱敏神经网络的强化学习的价值函数逼近
机译:基于减少值函数逼近的多主体强化学习方法
机译:强化学习的稀疏值函数逼近。
机译:使用参数化非中心Qu逼近模型的格拉帕统计噪声分析
机译:非策略强化学习中价值函数逼近的自适应重要性抽样
机译:基于多项式逼近的FpGa实现数值函数发生器设计方法。
机译:使用客观特定的动作值函数的多目标强化学习
机译:强化学习的价值函数表示方法及装置
机译:基于此的强化学习与装置的价值函数表示方法
抱歉,该期刊暂不可订阅,敬请期待!
目前支持订阅全部北京大学中文核心(2020)期刊目录。