退出
我的积分:
中文文献批量获取
外文文献批量获取
机译:无限地平线平均奖励马尔可夫决策过程的可分值函数
White D.J.;
机译:马尔可夫决策过程的近似后退地平线方法:平均奖励案例
机译:非齐次无限地平线马尔可夫决策过程的平均最优性
机译:无限地平线折扣马尔可夫决策过程中的决策滚动和地平线滚动过程
机译:无限地平线平均奖励马尔可夫决策过程的无模型加强学习
机译:基于后悔的马尔可夫决策过程的奖励启发。
机译:学习最大化奖励率:基于半马尔可夫决策过程的模型
机译:具有无穷大奖励的可数状态无限视野折现马尔可夫决策过程的有限状态近似
机译:具有贴现性的无限规划期间的部分可观察马尔可夫决策过程。
机译:使用面向对象部分可观察的马尔可夫决策过程操作机器人的系统和方法
机译:马尔可夫决策过程中过渡概率值的插值
机译:马氏决策过程中转移概率值的混合估计
抱歉,该期刊暂不可订阅,敬请期待!
目前支持订阅全部北京大学中文核心(2020)期刊目录。