...
机译:近似遍历平均奖励连续时间控制的马尔可夫链
Department of Statistics and Operations Research, UNED, Madrid, Spain;
Approximation of control problems; Ergodic Markov decision processes (MDPs); policy iteration algorithm;
机译:具有平均样本路径奖励的遍历连续时间马尔可夫链的最优控制
机译:连续时间受控马尔可夫链的统一遍历性:一项调查和新结果
机译:具有折扣奖励的连续时间控制马尔可夫链
机译:具有PathWise约束的连续时间马尔可夫链的ergodic控制
机译:具有风险敏感平均成本准则的受控马尔可夫链。
机译:允许无限不变测度的马尔可夫链的遍历理论
机译:连续时间马尔可夫链的亚几何遍历性