...
机译:非平稳可数状态马尔可夫决策过程-具有平均方差准则
discrete - time markov decision processes; average expected criteria; optimality equations; average variance criterion; optimal markov policies;
机译:非平稳可数状态马尔可夫决策过程-具有平均方差准则
机译:折现准则下无穷过渡和奖励率的可数状态连续时间马尔可夫决策过程
机译:具有平均成本多约束的可数连续时间马尔可夫决策过程
机译:具有平均奖励标准的可数控制马尔可夫链:样本路径最优
机译:具有风险敏感平均成本准则的受控马尔可夫链。
机译:为基于Markov的道路养护决策制定加权奖励标准
机译:具有无限成本,平均成本准则的可数状态半马尔可夫决策过程
机译:具有无界成本,平均成本准则的可量化状态半马尔可夫决策过程