声明
1 绪论
1.1 课题来源
1.2 研究背景与意义
1.3 国内外研究概况
1.3.1 非置换流水车间调度问题研究概况
1.3.2 深度强化学习的研究概况
1.4 论文的主要研究内容
2 基础理论
2.1 深度学习
2.1.1 深度神经网络
2.1.2 激活函数
2.1.3 优化算法
2.2 强化学习
2.2.1 马尔可夫决策过程
2.2.3 时序差分状态值迭代算法
2.3 深度时序差分强化学习
2.3.1 探索与利用
2.3.2 多维行为选择
2.3.3 算法模型和实施
2.4 本章小结
3 单目标非置换流水车间调度问题
3.1 问题描述
3.2 调度问题的转化
3.2.1 状态特征
3.2.2 启发式行为
3.2.3 状态转移与报酬
3.3 实例验证
3.3.1 标准测试集和实验平台
3.3.2 实验结果及分析
3.4 本章小结
4 多目标非置换流水车间调度问题
4.1 问题描述与数学模型
4.1.1 多目标优化问题
4.1.2 Pareto最优
4.2 多目标强化学习
4.2.1 基本架构
4.2.2 求解方法
4.3 优化目标
4.3.1 最大完工时间最小化目标
4.3.2 总能耗最小化目标
4.4 实例验证
4.4.1 标准测试集
4.4.2 实验结果及分析
4.5 本章小结
5 非置换流水车间动态调度问题
5.1 问题描述
5.2 动态调度目标
5.3 动态调度策略
5.4 实例验证
5.4.1 实例设计
5.4.2 性能指标
5.4.3 实验结果和分析
5.5 本章小结
6 总结与展望
6.1 全文总结
6.2 课题展望
致谢
参考文献
附录 攻读硕士期间发表论文