声明
第1章 绪论
1.1 课题研究背景及意义
1.2 生产调度问题概述
1.2.1 动态调度
1.2.2 动态事件
1.2.3 动态调度研究方法
1.3 国内外研究现状
1.3.1 调度问题研究现状
1.3.2 运输与生产协调研究现状
1.3.3 强化学习解决调度问题研究现状
1.4 本文主要研究内容
第2章 相关理论与方法
2.1 启发式规则
2.1.1 常见的启发式规则
2.1.2 启发式规则性能
2.2 强化学习
2.2.1 强化学习发展历程
2.2.2 强化学习简介
2.2.3 马尔可夫决策过程
2.2.4 Q-learning算法
2.2.5 函数逼近方法
2.2.6 强化学习中的探索和利用
2.2.7 强化学习的应用
2.3 本章小结
第3章 动态并行机生产调度问题研究
3.1 问题介绍
3.2 问题描述
3.3 基于强化学习调度问题转换
3.3.1 状态特征向量
3.3.2 动作
3.3.3 奖励函数
3.3.4 结合线性函数泛化器
3.3.5 算法流程
3.4 实验仿真
3.4.1 参数设置
3.4.2 实验仿真及结果分析
3.5 本章小结
第4章 运输与并行机生产协调调度问题研究
4.1 问题介绍
4.2 问题描述
4.3 基于强化学习协调调度问题转换
4.3.1 状态特征向量
4.3.2 动作
4.3.3 奖励函数
4.4 算法流程
4.5 实验仿真
4.5.1 参数设置
4.5.2 实验仿真及结果分析
4.6 本章小结
结论
参考文献
攻读硕士学位期间发表的论文和取得的科研成果
致谢
沈阳理工大学;