...
机译:用于想象力增强代理商的探索性推广政策
Harbin Inst Technol Sch Comp Sci &
Technol Harbin 150001 Heilongjiang Peoples R China;
Harbin Inst Technol Sch Comp Sci &
Technol Harbin 150001 Heilongjiang Peoples R China;
Harbin Inst Technol Sch Comp Sci &
Technol Harbin 150001 Heilongjiang Peoples R China;
Harbin Inst Technol Sch Comp Sci &
Technol Harbin 150001 Heilongjiang Peoples R China;
Harbin Normal Univ Sch Comp Sci &
Informat Engn Harbin Heilongjiang Peoples R China;
Model-based reinforcement learning; Implicit plan; Imagination-Augmented Agents; Exploratory rollout policy;
机译:用于想象力增强代理商的探索性推广政策
机译:多元强化学习:推出和政策迭代
机译:多元强化学习:推出和政策迭代
机译:嵌套的卷展策略适应制造中的多层系统优化
机译:具有差异评估和演进式推广策略的多主体蒙特卡洛树搜索
机译:结合探索性方案和参与式回播:在多用途环境的参与式策略设计中使用基于代理的模型
机译:结合探索性方案和参与式回播:在多用途环境的参与式策略设计中使用基于代理的模型