机译:Laurent系列,敏感折扣和Blackwell最优性用于连续时间受控的Markov链
continuous-time controlled Markov chains (also known as Markov decision processes); Laurent series; sensitive discount criteria; Blackwell optimality; average reward criteria; BOREL STATE-SPACE; UNBOUNDED REWARDS; DECISION CHAINS; DISCRETE-TIME; POLICIES;
机译:Laurent系列,敏感折扣和Blackwell最优性用于连续时间受控的Markov链
机译:连续时间受控马尔可夫链的马尔可夫策略类中的Blackwell最优性
机译:折扣连续时间受控马尔可夫链:控制模型的收敛
机译:具有风险敏感平均标准的受控马尔可夫链的最新结果:消失的贴现法
机译:具有风险敏感平均成本准则的受控马尔可夫链。
机译:动态模拟端点空调连续时间的马尔可夫链在有限状态空间应用程序分子进化
机译:折扣连续时间控制马尔可夫链:控制模型的融合
机译:具有Borel状态空间和无界奖励的马尔可夫决策链中所有策略类的Blackwell最优性