声明
摘要
1.1研究背景及意义
1.2主要研究内容及技术路线
1.3论文总体结构
1.4本章小结
第2章研究综述及理论基础
2.1钢卷库物流优化问题简介
2.2研究综述
2.3强化学习理论基础
2.3.1强化学习的发展及其研究现状
2.3.2强化学习原理
2.3.3 Rollout算法
2.3.4蒙特卡洛树搜索
2.4本章小结
第3章钢卷库物流运作优化的启发式算法
3.1符号描述
3.2动态规化模型
3.3启发式算法
3.3.1近邻法
3.3.2最小倒垛次数法
3.3.3最小堆积数法
3.4实验分析
3.4.1案例设计
3.4.2实验环境与实验结果分析
3.5本章小结
第4章基于强化学习的Rollout算法
4.1基于强化学习的动态规划模型
4.2 Rollout算法
4.2.1 Rollout算法应用机制
4.2.2 Rollout算法的扩展
4.3基于Rollout算法的蒙特卡洛树搜索算法
4.4实验分析
4.4.1案例设计
4.4.2实验环境与实验结果分析
4.5本章小结
5.1总结
5.2展望
参考文献
致谢
东北大学;