机译:从多主体系统中未采取的行动中学习
Multiagent learning; counterfactual reward; difference reward;
机译:通过分数级迭代学习控制共识跟踪分数级多算系统
机译:基于分数次幂误差信号的线性异构多主体系统迭代学习控制共识跟踪
机译:基于绩效指数的观察者型迭代学习控制,用于不确定非线性分数多算系统的共识跟踪
机译:用于多主体系统的虚拟实验室:结合功效,学习分析和学生满意度
机译:用动力系统解释集体行为:多核化趋化性的空间梯度传感和多核强化学习中的学习动态
机译:使用多主体社会学习框架动态分析生物环境中的细胞相互作用
机译:从多代理系统中未采取的行动中学习
机译:清理奖励:在多智能体学习中消除探索性行为噪声的反事实行动(扩展摘要)。