Tecnologico de Monterrey Campus Cuernavaca, Autopista del Sol Km 104+06,Colonia Real del Puente, 62790, Xochitepec, Morelos, Mexico;
Tecnologico de Monterrey Campus Cuernavaca, Autopista del Sol Km 104+06,Colonia Real del Puente, 62790, Xochitepec, Morelos, Mexico;
Tecnologico de Monterrey Campus Estado de Mexico;
markov decision processes; policy iteration; cosine simplex method; hybrid method;
机译:不确定关联Markov决策过程的多层感知器神经网络的近似鲁棒策略迭代
机译:具有策略语言偏差的近似策略迭代:解决关系马尔可夫决策过程
机译:具有策略语言偏差的近似策略迭代:解决关系马尔可夫决策过程
机译:余弦政策迭代,用于解决无限地平线马尔可夫决策过程
机译:马尔可夫决策过程的迭代方法的加速。
机译:通过内在动机的自我博弈在多目标马尔可夫决策过程中发展稳健的政策覆盖范围
机译:使用策略语言偏差进行近似策略迭代:求解 关系马尔可夫决策过程
机译:求解马尔可夫决策过程的进化策略迭代