机译:基于层次强化学习的钢琴搬家问题研究
Hakodate Institute of National College of Technology, Hakodate-shi, 042-8501 Japan;
reinforcement learning; piano mover's problem; heterogeneous multi-agent; find-path problem; obstacle avoidance;
机译:新钢琴练习者的强化学习
机译:分层学习系统的专业化:统一的信息 - 监督,无监督和强化学习的理论方法
机译:一种有效的无模型方法,用于通过分层加固学习控制大型运河
机译:使用等级加强学习实现异构试剂的合作行为 - 一种钢琴搬家问题的方法
机译:使用依赖于动作的分区来学习状态和动作空间层次结构,以进行强化学习。
机译:上行链路中的分层QoS的双动态调度:强化学习方法
机译:评估加固学习学习和猜测策略的等级贝叶斯方法