机译:具有有限需求的随机需求的电子零售中的动态包装:一种Q学习方法
e-retailing; dynamic packaging; q-learning;
机译:使用Q-Learning完全未知动态的离散时间线性系统的有限视线最优控制
机译:随机逻辑动力系统有限水平最优控制算法的代数表达式
机译:设置成本,有限时限和离散随机需求的求解单层容量生产计划模型的新组合方法
机译:电子零售环境中基于实时需求学习的动态定价Q学习方法
机译:具有确定性,动态需求和随机供应中断的有限水平库存问题。
机译:受约束的深度Q学习逐渐接近普通Q学习
机译:使用Q-Learning完全未知动态的离散时间线性系统的有限视线最优控制