机译:基于模拟的马尔可夫决策过程优化:一种经验过程理论方法
Markov decision processes; Learning algorithms; Monte Carlo simulation; Stochastic Control; Optimization;
机译:基于模拟的马尔可夫决策过程优化:一种经验过程理论方法
机译:Markov更新理论和半马尔可夫决策过程在多单元系统维护建模和优化中的应用
机译:连续时间马尔可夫过程偏差矩阵的一种近似方法及其在马尔可夫决策理论中的应用
机译:基于模拟的马尔可夫决策过程的PAC界限
机译:基于模拟的马尔可夫决策过程算法。
机译:隐参数马尔可夫决策过程:发现潜在任务参数化的半参数回归方法
机译:有限视野马尔可夫决策过程的基于仿真的优化算法