机译:固定时间空间差异游戏申请普里雷普雷斯模糊演员 - 评论家算法
机译:通过应用预测模型对移动机器人进行控制的自适应行为者批判学习
机译:用于计算均值方差客户组合的先验知识/行为者批评强化学习架构:银行营销活动的案例
机译:将地区自然演员 - 评论家批评建筑应用于电机原始学习
机译:用于模拟情景记忆的新型神经体系结构:远距奖励学习的计算研究。
机译:运动学习的新方法:使用中央模式生成器和动态运动原语的Actor-Critic体系结构
机译:一种新的运动学习方法:使用中央模式发生器和动态运动原语的演员批评结构
机译:sOaR中经验,分析和情景学习整合的建构方法研究