机译:在无序观察的因式分解马尔可夫决策中进行强化学习:并行Q学习在迷宫和纽约驾驶问题中的实验研究
Laboratoire d'Automatique de Besanç
on -UMR CNRS 6596 24 rue Alain Savary, F-25000 Besanç
on;
apprentissage par renforcement; Q-Learning; W-Learning; DBN-MDP; PDM facto-risé; PDMFOD;
机译:在医学研究课程中引入“问题方法”:我们是否必须从开始以诅咒开始?
机译:复合生产和原油和天然气体运输中的水合物问题:水合物产生操作困难的可能解决方案
机译:土/葡萄系统水力运行研究中的电导率电阻率测量
机译:社会支持在父母的恢复过程中的作用,让孩子从Toutete(SGT)综合征的吉尔唤醒?
机译:粘贴中传热的研究在多年冻土的矿业项目边境条件下嵌入CIMMEDES
机译:将对健康影响的考虑纳入土地使用计划的批准过程:制定基本的健康研究框架
机译:在可观察到的无序马尔可夫决策过程中进行强化学习。并行Q学习的实验研究适用于迷宫和纽约驾驶问题。
机译:对于密度热常数FLOW IN向数普朗特的应用领域管内梁传热的平行流动的实验研究