Standards; Markov processes; Biological system modeling; Dynamic programming; Mathematical model; Current measurement; History;
机译:凸折扣马尔可夫决策过程中最优策略的非唯一性与唯一性
机译:凸折扣马尔可夫决策过程中最优策略的非唯一性与唯一性
机译:具有独立于电流状态的转移概率的马尔可夫折扣决策过程中的单调最优策略:存在性和近似性
机译:依次观察过渡的马尔可夫决策过程凸出的合成
机译:分段仿射和凸马尔可夫决策过程的混合遗传/优化算法。
机译:通过内在动机的自我博弈在多目标马尔可夫决策过程中发展稳健的政策覆盖范围
机译:吸收具有多个约束的半马尔可夫决策过程的后悔最优策略(信息和决策过程的发展)
机译:关于马尔可夫过程的两个简短说明:I。马尔可夫决策问题中次优最优行动的检验。 II。本质上确定的马尔可夫链