AI写作工具
文献服务
退出
我的积分:
中文文献批量获取
外文文献批量获取
机译:基于基于亚古国的奖励,提高加固学习效率
Takato Okudo; Seiji Yamada;
机译:在线学习塑造强化学习中的奖励。
机译:利用Lyapunov稳定性理论对强化学习的原则奖励塑造
机译:基于计划的奖励成型,用于多主体强化学习
机译:奖励函数估算逆加强学习中的学习效率
机译:奖励预测错误在加固学习期间形状内存
机译:增强Q学习控制在半主动假肢膝关节中为摆动相位控制的奖励塑造功能
机译:在线学习在强化学习中塑造奖励
机译:从人类奖励中学习强化学习:奖励积极性,时间贴现,情节性和表现。
机译:自动化加强基于学习的应用程序管理器,用于学习和提高奖励功能
机译:基于自动学习的学习管理和奖励功能的应用程序管理器
机译:用于计算机系统中的垃圾收集的系统和方法,该系统和方法使用强化学习来调整内存空间的分配,计算奖励并使用奖励来确定要对内存空间采取的进一步操作
抱歉,该期刊暂不可订阅,敬请期待!
目前支持订阅全部北京大学中文核心(2020)期刊目录。