机译:自适应MDP的模式矩阵学习算法:定期交流的案例(不确定情况下决策分析的理论和应用)
机译:使用优先级Q学习算法的自适应视觉跟踪:基于MDP的参数学习方法
机译:在不确定的马尔可夫决策过程(MDP)中将后悔最小化的基于采样的方法
机译:基于对不确定的马尔可夫决策过程中遗憾的基于方法(MDPS)
机译:REGAL:弱通信的MDP中基于正则化的强化学习算法
机译:在不确定和风险情况下决策的多学科视角:企业家精神的应用。
机译:数据分析熵措施:理论算法和应用
机译:马尔可夫到达过程叠加的EM算法(不确定情况下决策分析的理论与应用)
机译:弱耦合mDp的强化学习及其在行星探测器控制中的应用