声明
1 绪论
1.1 研究背景
1.2 研究现状
1.3 交通信号控制基本概念
1.4 本文的主要工作和组织结构
1.4.1 主要工作
1.4.2组织结构
2 强化学习及其在交通信号自动控制中的应用
2.1 强化学习简介
2.1.1 强化学习及其发展
2.1.2 强化学习分类
2.2 强化学习用于交通信号自动控制
2.2.1 交通建模
2.2.2 基于交通建模的强化学习用于交通信号自动控制
2.2.3 强化学习方法的应用现状与问题
2.3 本章小结
3 基于Q学习的交通信号控制算法
3.1 马尔科夫决策过程
3.1.1 马尔科夫决策过程介绍
3.1.2 值函数及贝尔曼最优公式
3.2 Q学习算法
3.2.1 MDP的求解算法
3.2.2 深度 Q学习
3.2.3 交通信号自动控制中的深度 Q学习算法
3.2.4 深度 Q学习算法的改进
3.3 本章小结
4 基于单智能体强化学习的多路口交通信号自动控制方法
4.1 仿真环境介绍
4.1.1 多路口及车辆数据介绍
4.1.2 各个交通信号灯相位要求
4.2 强化学习算法部分介绍
4.2.1 深度强化学习算法模型
4.2.2 状态设置与动作约束
4.3 仿真实验与结果比较
4.3.1 实验参数与结果
4.3.2 与其他模型的比较
4.4 本章小结
5 基于单智能体强化学习的交通信号控制系统设计与实现
5.1 主要功能设计
5.2 基于单智能体强化学习的交通信号控制系统介绍
5.2.1 用户界面介绍
5.2.2 交互流程演示
5.3 本章小结
6 总结与展望
6.1 本文总结
6.2 问题与展望
致谢
参考文献
附录
南京理工大学;