声明
第1章 绪论
1.1研究背景
1.1.1互联网购物的发展
1.1.2电商服务的发展
1.1.3网络购物顾客需求分析
1.2研究内容与意义
1.2.1研究内容
1.2.2研究意义
1.3研究方法及论文框架
1.3.1研究方法
1.3.2论文思路及框架
第2章 文献综述
2.1引言
2.2 IRP问题配送策略理论研究
2.2.2固定分区策略的IRP问题研究
2.2.3直接配送策略的IRP问题研究
2.3马尔可夫决策过程模型研究综述
2.4关于顾客流失率的研究综述
2.5本章小结
第3章 考虑顾客流失率的随机库存路径问题研究
3.1问题描述和假设
3.2考虑顾客流失率的随机库存路径问题模型
3.2.1变量定义
3.2.2马尔可夫决策过程模型描述
3.3传统策略迭代法求解马尔可夫决策过程
3.4本章小结
第4章 求解马尔可夫决策过程模型的算法
4.1引言
4.2强化学习与深度学习
4.3 Q-learning算法
4.4 Deep Q Network算法
4.4.1 算法思想
4.4.2 experience replay 经验池
4.4.3 Q-target 目标网络
4.5算法流程
4.5.1前置公式
4.5.2 初始化参数
4.5.3贪婪策略选择下一个动作
4.5.4关于网络参数的随机梯度下降
4.6算法实现
4.7本章小结
第5章 仿真分析
5.1仿真案例介绍
5.2 测试结果与分析
5.2.1测试结果
5.2.2大规模算例仿真
5.3顾客流失率对仿真结果的影响
5.4本章小结
第6章 结论与展望
6.1 总结
6.2 研究展望
参考文献
致谢
东华大学;