机译:内核动态策略编程:适用于具有高维状态的机器人系统的适用加固
Graduate School of Information Science Nara Institute of Science and Technology;
Graduate School of Information Science Nara Institute of Science and Technology;
Graduate School of Information Science Nara Institute of Science and Technology;
Reinforcement learning; Kernel methods; Robot learning;
机译:内核动态策略编程:适用于具有高维状态的机器人系统的适用加固
机译:具有安全否决权政策的强化学习可学习链接多组件机器人系统的控制
机译:未知动态环境中基于遗传网络编程增强学习的安全和平滑移动机器人导航
机译:内核动态策略编程:高维机器人的实用强化学习
机译:通过将线性规划和强化学习相结合,应对维度的诅咒。
机译:探索功能维度以在不知情的强化学习任务中学习新策略
机译:基于机器人加强学习精确的基于学习分类器系统,具有模糊政策梯度下降(XCS-FPGR1)