退出
我的积分:
中文文献批量获取
外文文献批量获取
赵昀; 陈庆伟; 胡维礼;
南京理工大学自动化学院;
江苏南京;
210094;
强化学习; 强化学习体系结构; 规划;
机译:Dyna-H:一种启发式计划强化学习算法,应用于角色扮演游戏策略决策系统
机译:使用Dyna和策略逼近在连续状态和动作空间中进行有效的强化学习
机译:基于价值函数的强化学习算法的统一分析
机译:使用探索代理和dyna-Q算法的并行强化学习系统
机译:用于联合,批量和强化学习的可证明和高效的算法
机译:基于非对称广义Jacobi Petrov-Galerkin方法求解三阶和五阶两点边值问题的新算法
机译:通过使用增量式一阶决策树算法来加速关系强化学习
机译:线性二阶分析中线性化,近似和计算算法的意义
机译:用于电子部件的n阶开关器件具有低n阶开关器件,该低阶n阶开关器件产生用于控制晶体管的栅极的控制信号,使得分支导电的晶体管和另一分支的晶体管被阻挡
机译:包装用DYNA,包装用DYNA的使用,包装系统和包装程序
机译:交流网络单工推挽式转换器-通过为步阶的切换瞬间提供更大的自由度,改善了步阶对称的四分之一波
抱歉,该期刊暂不可订阅,敬请期待!
目前支持订阅全部北京大学中文核心(2020)期刊目录。