...
机译:约束条件下分数马氏决策过程中的鞍点类型最优性准则和对偶性
Department of Systems Engineering Graduate School of Information Sciences Hiroshima City University 3-4-1, Ozuka-Higashi Asaminami-ku Hiroshima 731-3194 Japan;
Markov decision process; Fractional reward; Lagrangian function; Duality; Saddle point;
机译:带有约束的分数马尔可夫决策过程中的马鞍点类型最优性标准和二元性
机译:广义非线性分数规划的对偶性和鞍点型最优性
机译:首次通过标准的半马尔可夫决策过程的均方差最优
机译:具有安全阈值约束的马尔可夫决策过程的鲁棒最优策略
机译:马尔可夫决策过程和近似动态规划方法进行最优处理设计
机译:不确定性下的决策:基于部分可观察的马尔可夫决策过程的神经模型
机译:广义非线性分数规划的对偶性和鞍点型最优性
机译:马尔可夫决策过程的风险敏感最优性准则。