Algorithms; Decision making; Markov processes; Problem solving; Air force research; Convex bodies; Dynamic programming; Learning; Methodology; Optimization; Series(Mathematics);
机译:原型功能:一个拉普拉斯框架,用于学习马尔可夫决策过程中的表示和控制
机译:可控的马尔可夫跳跃过程。 Ⅱ。监视和优化TCP连接
机译:可控马尔可夫跳跃过程。 Ⅱ。监控和优化TCP连接
机译:连续马尔可夫决策过程中的学习表示与控制
机译:部分可观察的马尔可夫决策过程的模型学习和应用。
机译:使用局部可观察的马尔可夫决策过程对缺血性心脏病的治疗进行建模。
机译:在Markov决策过程中学习表示和控制:新领域