Portfolios; Instruments; Heuristic algorithms; Reinforcement learning; Security; Optimization; Resource management;
机译:具有多种深度确定性政策梯度算法的深度集成钢筋学习
机译:基于跨越蒙特 - 卡洛深度确定性政策梯度的批量学习基于批处理流程的最优控制
机译:异步epiSodic深度确定性政策梯度:在计算复杂环境中连续控制
机译:使用深度确定性政策梯度的风险感知投资组合建设
机译:政策感知模型学习策略梯度方法
机译:控制动态双足行走的深度确定性策略梯度的实现
机译:基于股票投资组合管理的深度确定性政策梯度战略