机译:基于Nash-Q学习的互联电力系统协同u200bu200b调度策略
机译:基于Web的协作系统,用于在战略噪声映射域内将知识转移到分布式用户组
机译:基于加强学习的碰撞避免:奖励功能的影响和知识转移
机译:基于NASH-Q学习的战略知识分发奖励
机译:使用分布式奖励制定学习基于模型的强化学习的政策
机译:小脑相关学习与基底神经节奖励学习的神经调节自适应结合用于目标定向行为控制
机译:章节:``区块链和荣誉:教育记录,声誉和奖励的分布式系统'',摘自书:适应性和适应性学习:第11届欧洲技术增强学习大会,EC-TEL 2016,法国里昂,2016年9月13日至16日,会议记录