机译:有界参数部分可观察的马尔可夫决策过程:框架和算法
School of Information Technology and Management,University of International Business and Economics,Beijing, 100029, China;
School of Creative Media, City University of Hong Kong,Hong Kong, China;
Decision making under uncertainty; planning under uncertainty; bounded-parameter POMDP; modified value iteration; ULVI algorithm;
机译:部分可观察的马尔可夫决策过程的脉冲神经网络强化学习算法
机译:部分可观马尔可夫决策过程的最优可观性:离散状态空间
机译:两个动作部分可观察到的Markov决策过程的单调性属性在部分有序空间上
机译:有界参数部分可观察的马尔可夫决策过程
机译:用于集中式和分散式部分可观察的马尔可夫决策过程的算法中的可伸缩性不断增强:在不确定的环境中进行有效的决策和协调。
机译:不确定性下的决策:基于部分可观察的马尔可夫决策过程的神经模型
机译:部分可观测马尔可夫决策过程的算法