Linear programming ; Decision theory ; Markov chains ; Optimization ; Algorithms ; Theorems;
机译:具有Borel状态空间和无穷大奖励的Markov决策链中所有策略类别的Blackwell最优性
机译:马尔可夫决策链中强度和N实值最佳政策的多项式计算
机译:带有平均奖励标准的稳定马尔可夫决策链中的样本路径最优平稳策略
机译:马尔可夫决策过程框架下最佳最小修复/替换政策的敏感性分析
机译:国际金融网络和全球供应链:决策,优化和风险管理的统一框架。
机译:马尔可夫决策过程框架中的最佳信息收集策略
机译:具有无穷回报的可数马尔可夫决策链中的平均,敏感和布莱克韦尔最优策略
机译:寻找马尔可夫决策链的最优政策:一个统一的方差 - 权衡 - 权衡