首页> 中文期刊> 《管理学报》 >强化学习算法在供应链环境下的库存控制中的应用

强化学习算法在供应链环境下的库存控制中的应用

         

摘要

以两级库存为例,提出了一种优化库存管理的方法.该方法包含3种技术:马尔可夫决策过程、马尔可夫博弈和一种用于求解马尔可夫博弈的强化学习算法.具体操作过程是,将一个两级的库存系统通过马尔可夫博弈建模,再用马尔可夫博弈和强化学习的知识求解该模型,并得出该系统的优化解.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号