Training; Monte Carlo methods; Space missions; Decision making; Reinforcement learning; Real-time systems; Iterative algorithms;
机译:基于近端点的字典更新方法的改进优化算法
机译:一种预先训练的近端策略优化算法,奖励飞机指导在三维连续空间中移动目的地的飞机指导
机译:松弛约束的基于拉格朗日的近似点算法用于线性约束的凸优化
机译:使用混合(on和OFF)政策强化学习的N步骤算法
机译:基于频率响应函数的模型更新算法,用于在役桥梁的状态评估。
机译:具有函数值信息和N步二次收敛的共轭梯度算法无约束优化
机译:无约束优化的具有函数值信息和N步二次收敛的共轭梯度算法。