Stochastic processes; Reinforcement learning; Prediction algorithms; Reliability; Task analysis; Portfolios; Robots;
机译:在线更新机制的混合电动跟踪车辆的深度确定性政策梯度基于能量管理策略
机译:使用双胞胎延迟的非理性行为的混合动力车辆智能能量管理策略深度确定性政策梯度
机译:具有多种深度确定性政策梯度算法的深度集成钢筋学习
机译:基于深度确定的基于政策梯度的股票制度策略
机译:投资组合管理的深度增强学习
机译:控制动态双足行走的深度确定性策略梯度的实现
机译:基于股票投资组合管理的深度确定性政策梯度战略