Markov processes; Decision making; Dynamic programming; Queueing theory; Control sequences; Inventory control; Convergence; Discrete distribution; Time dependence; Theorems;
机译:关于平均成本马尔可夫决策过程的最小对方法,可数离散行动空间和严格无限成本
机译:具有无限制利率和依赖历史的随机策略的折扣连续时间马尔科夫决策过程:动态规划方法
机译:利率无限的连续马尔可夫决策过程:凸分析方法
机译:在非绑定奖励中发现非静止马尔可夫决策过程中最佳解决方案视野
机译:被杀死的对称马尔可夫过程的谱性质及其在无界域中的布朗运动的应用
机译:隐参数马尔可夫决策过程:发现潜在任务参数化的半参数回归方法
机译:具有无界的折扣连续时间马尔可夫决策过程 费率:动态规划方法
机译:具有无界收益的马尔可夫决策过程的移位函数方法