Aircraft; Atmospheric modeling; Training; Testing; Neural networks; Reinforcement learning; Games;
机译:学习飞行:具有强化学习功能的混合无人机的计算控制器设计
机译:利用加固学习的多人追求逃避游戏的合作控制
机译:背景:使用加强学习,培养人类可读,国家依赖的爆发响应政策
机译:用加固学习开发无人驾演逃守政策
机译:使用强化模糊学习在追逃性差分游戏中学习。
机译:上下文很重要:使用强化学习来开发人类可读的取决于状态的暴发应对策略
机译:无人机自动空中作战机动策略生成基于国家对冲深度确定性政策梯度和反增强学习的观察误差