Department of Information Engineering and Computer Science, University of Trento, 38050 Povo di Trento, Italy;
机译:模糊强化学习中的勘探与开发平衡管理
机译:单轨强化学习的学习探索/开发策略
机译:学习与创新:开发与探索的权衡
机译:对话管理加固学习的探索/剥削权衡
机译:用于学习双模对话策略的最大最大逆钢筋学习
机译:人类运动学习中隐含的探索与开发权衡
机译:对话管理中强化学习中的探索/开发权衡