Chalmers-University of Gothenburg;
National Institute of Informatics Graduate University for Advanced Studies;
Chalmers-University of Gothenburg Università degli Studi dell’Aquila;
Waseda University;
Monitoring; Runtime; Safety; Reinforcement learning; Probabilistic logic; Software agents;
机译:使用座席状态发生频率并分析多座席环境中座席学习过程中的知识共享的强化学习技术
机译:使用代理状态发生频率并分析多代理环境中代理学习过程中的知识共享的强化学习技术
机译:强化学习,共同学习和元学习的统一框架,如何在协作式多智能体系统中进行协调
机译:运行时监控框架,以强制探索复杂环境的强化学习代理的不变性
机译:多代理虚拟环境的协作强化学习框架。
机译:失败不是四个字母的单词:探索大学生在STEM学习环境中应对学业挑战和对失败的应对方法的理论框架
机译:复杂游戏环境中人工智能主体的模块化强化学习架构