机译:约束平均成本马尔可夫决策过程的最优策略
Departamento de Probabilidad y Estadística Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas Universidad Nacional Autónoma de México Apartado postal 20-726 Admon. No. 20 delegación álvaro Obregón 01000 Mexico City D.F. Mexico;
Posgrado en Ingeniería de Sistemas Facultad de Ingeniería Mecánica y Eléctrica Universidad Autónoma de Nuevo León Ciudad Universitaria 66450 San Nicolás de los Garza N.L. Mexico;
Markov decision processes; Constraints; Stable measures; 90C40;
机译:约束平均成本马尔可夫决策过程的最优策略
机译:历史相关策略中一般连续时间马尔可夫决策过程的线性规划和约束平均最优性
机译:Borel空间和不同折扣因子的Markov决策过程的限制性问题
机译:单调信道感知传输策略的最优性:约束马尔可夫决策过程
机译:约束马尔可夫决策过程的结构结果
机译:通过内在动机的自我博弈在多目标马尔可夫决策过程中发展稳健的政策覆盖范围
机译:约束平均成本马尔可夫决策过程的最优策略
机译:关于马尔可夫过程的两个简短说明:I。马尔可夫决策问题中次优最优行动的检验。 II。本质上确定的马尔可夫链