机译:贝叶斯非参数方法的部分可观察的强化学习
Computer Science and Artificial Intelligence Laboratory, MIT, Cambridge, MA, USA;
Bayes methods; Computational modeling; Hidden Markov models; History; Knowledge representation; Learning (artificial intelligence); Markov processes; Artificial intelligence; HDP-HMM; POMDP; Reinforcement Learning; hierarchial Dirichlet process hidden Markov model; machine learning; partially-observable Markov decision process; reinforcement learning;
机译:在部分可观察的环境中基于梯度的强化学习方法进行动态定价
机译:部分可观察的多智能体游戏的强化学习方案
机译:讨论“应用中的非参数贝叶斯推断”:计量经济学中的贝叶斯非参数方法
机译:部分可观察竞争游戏的多智能体强化学习方法
机译:LTE和Wi-Fi共存的贝叶斯非参数增强学习
机译:一种非参数贝叶斯方法将机器学习分数转换为临床决策支持中的概率
机译:部分可观测强化学习的贝叶斯非参数方法