机译:一种有约束力的行为者与批判强化学习算法,应用于航空公司收益管理
Missouri Univ Sci & Technol, Dept Engn Management & Syst Engn, Rolla, MO 65409 USA;
Missouri Univ Sci & Technol, Dept Engn Management & Syst Engn, Rolla, MO 65409 USA;
Reinforcement learning; Actor critics; Airline revenue management;
机译:应用于航空公司收入管理的有界演员批评批评学习算法
机译:加强学习适用于航空公司收入管理
机译:在运动过程中使用基于行为准则的强化学习算法来控制三链肌骨骼肌的学习
机译:走向下一代航空公司收入管理:座椅库存控制和超预订的深度加强学习方法
机译:一种有限于钢筋学习的批评算法
机译:怀疑论者遇到演员批评者:重新思考基础神经节通路在决策和强化学习中的作用
机译:用于分布式强化学习的多功能脱机演员 - 批评算法