Optimization; Decision making; Estimates; Markov processes; Dynamic programming; Algorithms; Errors; Convergence; Monte carlo method; Policies; Computerized simulation;
机译:动态非线性随机程序的通用采样算法的全局收敛性
机译:动态随机规划问题的采样算法的收敛性
机译:具有补货机会的动态定价模型中(s,S)策略的最优性:一种样本路径方法
机译:多储层系统最优策略的随机动态规划模型
机译:关于用于增强学习的无模型策略迭代算法的收敛:不连续平均动力学下的随机逼近。
机译:设计评估研究以最佳地为政策提供信息:中国的决策者在制定医护人员培训计划的资源分配决策时会考虑哪些因素?
机译:随机动态规划中样本路径最优策略的收敛性