退出
我的积分:
中文文献批量获取
外文文献批量获取
机译:平均成本单链马尔可夫决策过程的基于仿真的策略迭代算法
Ying He; Michael C. Fu; Steven I. Marcus;
机译:具有一般状态空间的平均奖励马尔可夫决策过程的策略迭代算法
机译:具有BOREL空间和绑定成本的平均成本MARKOV决策过程的近似值迭代的扰动方法
机译:具有Borel空间和界限成本的平均成本马尔可夫决策过程近似值迭代的扰动方法
机译:针对平均成本马尔可夫决策过程的优化值迭代算法
机译:基于模拟的马尔可夫决策过程算法。
机译:通过内在动机的自我博弈在多目标马尔可夫决策过程中发展稳健的政策覆盖范围
机译:基于部分可观察的马尔可夫决策过程的政策建模装置和方法
机译:使用马尔可夫决策过程策略的头像动画
抱歉,该期刊暂不可订阅,敬请期待!
目前支持订阅全部北京大学中文核心(2020)期刊目录。