Games; Task analysis; Neural networks; Reinforcement learning; Training; Real-time systems; Intelligent control;
机译:具有强化学习和课程转移学习功能的《星际争霸》微管理
机译:具有多种深度确定性政策梯度算法的深度集成钢筋学习
机译:基于跨越蒙特 - 卡洛深度确定性政策梯度的批量学习基于批处理流程的最优控制
机译:在星际微臂中转移学习框架的深度确定性政策梯度
机译:关于游戏的深度加固学习:多重政策头部深度Q学的泛化
机译:控制动态双足行走的深度确定性策略梯度的实现
机译:无人机自动空中作战机动策略生成基于国家对冲深度确定性政策梯度和反增强学习的观察误差