机译:关于平均成本马尔可夫决策过程的最小对方法,可数离散行动空间和严格无限成本
机译:具有BOREL空间和绑定成本的平均成本MARKOV决策过程的近似值迭代的扰动方法
机译:具有Borel空间和界限成本的平均成本马尔可夫决策过程近似值迭代的扰动方法
机译:使用总成本标准和风险均值的有限马尔可夫决策过程中的风险规避
机译:具有信息流和可变交易成本的SEMI-MARKOV投资决策过程。
机译:不确定性下的决策:基于部分可观察的马尔可夫决策过程的神经模型
机译:具有Doeblin条件的平均成本Markov决策过程的功能表征
机译:具有无界成本,平均成本准则的可量化状态半马尔可夫决策过程