退出
我的积分:
中文文献批量获取
外文文献批量获取
机译:基于策略梯度的独立于任务的高效强化学习方法(基于策略梯度的独立于任务的高效Ihi学习方法)
森村哲郎;
強化学習; マルコフ決定過程; 方策勾配法; 自然勾配法; 状態定常分布の偏微分;
机译:通过策略梯度方法学习基于CPG的节能两足动物
机译:通过策略梯度法学习基于CPG的节能双足步行
机译:基于概率梯度滴的非线性优化方法:如何自适应调整梯度估计的衰减因子
机译:基于具有异质碱基组成的基因序列数据寻找合适的进化系统树估计方法:数据记录方法和异质模型的有效性验证
抱歉,该期刊暂不可订阅,敬请期待!
目前支持订阅全部北京大学中文核心(2020)期刊目录。