Faculty of Information Sciences Hiroshima City University Hiroshima, 731-3194, Japan;
reinforcement learning; Q-learning; stochastic games; markov games;
机译:使用强化学习的离散多主体系统最优共识控制的Q学习解决方案
机译:零售店应用中动态决策的多主体协同强化学习算法性能比较
机译:一种使用遗传算法的混合算法和多元素增强学习启发式解决旅行推销员问题
机译:使用扩展最优响应的多主体强化学习算法
机译:用动力系统解释集体行为:多核化趋化性的空间梯度传感和多核强化学习中的学习动态
机译:多主体合作与竞争与深度强化学习
机译:多读强度学习中知识重用的方法和算法