Mitsubishi Electric Research Laboratories 201 Broadway Cambridge MA 02139 USA;
Markov decision process models; dynamic programming; embedded Markov chains; optimal control;
机译:波兰空间中连续时间跳跃马尔可夫决策过程的偏差和超车最优
机译:波兰空间中连续时间马尔可夫决策过程的平均最优不等式
机译:波兰空间中连续时间马尔可夫决策过程的平均最优性
机译:波兰空间中连续时间马尔可夫决策过程的折扣最优性
机译:使用子空间技术的实时最佳控制,用于带有DSP实现的嵌入式系统。
机译:使用基于模型的建议对离散状态空间连续时间马尔可夫过程进行快速参数推断
机译:具有连续状态空间的非线性系统最优控制的嵌入马尔可夫决策过程的构造
机译:无界成本半马尔可夫决策过程理论及其在排队系统最优控制中的应用。