AI写作工具
文献服务
退出
我的积分:
中文文献批量获取
外文文献批量获取
机译:马尔科夫决策过程中的在线学习,任意改变奖励和转换
Jia Yuan Yu; Shie Mannor;
机译:具有任意奖励过程的马尔可夫决策过程
机译:带有任意奖励过程的马尔可夫决策过程
机译:具有任意奖励的连续马尔可夫决策过程的期望最大化算法
机译:马尔可夫决策过程中的在线学习,可任意更改奖励和过渡
机译:马尔可夫奖励过程的自适应在线优化及其在多类亏损网络服务定价中的应用。
机译:学习最大化奖励率:基于半马尔可夫决策过程的模型
机译:马克思主义决策过程具有不确定的过渡概率或奖励
机译:马尔可夫决策过程中过渡概率值的插值
机译:马氏决策过程中转移概率值的混合估计
抱歉,该期刊暂不可订阅,敬请期待!
目前支持订阅全部北京大学中文核心(2020)期刊目录。