声明
专用术语注释表
第一章绪论
1.1课题研究背景及意义
1.2交通信号控制方法的研究现状
1.2.1智能交通的研究现状
1.2.2单交叉口的交通信号控制方法
1.3论文研究内容
1.4论文组织架构
第二章相关背景知识介绍
2.1.2 Paramics仿真平台
2.1.3 SUMO仿真平台
2.2.1基本原理
2.2.2 Q-learning
2.3深度强化学习概述
2.3.1深度神经网络
2.3.2深度Q网络
2.4本章小结
第三章 交通控制仿真平台的设计与构建
3.1.1交通信号的基本参数
3.1.2性能评价参数
3.2.1设计目标
3.2.2功能模块简介
3.3强化学习框架下的交通信号控制问题
3.3.1规则制定
3.3.2状态表示
3.3.3动作空间
3.3.4奖励函数
3.3.5车流设定
3.4本章小结
第四章 基于双竞争网络的宽度强化学习交通信号控制方法
4.2.1宽度学习
4.2.2宽度强化学习
4.3基于DDBRL的交通控制算法
4.3.1 Double BRL
4.3.2 Dueling BRL
4.3.3 DDBRL算法实现
4.4仿真结果与实验分析
4.4.1实验设置
4.4.2结果分析
4.5本章小结
第五章 基于半监督双竞争网络宽度强化学习的交通信号控制方法
5.2.1基于伪标签的半监督学习
5.2.2 semi-DDBRL整体架构
5.3仿真实验与结果分析
5.3.1实验设置
5.3.2结果分析
5.4本章小结
第六章 总结与展望
6.2未来展望
参考文献
附录1 攻读硕士学位期间撰写的论文
附录2 攻读硕士学位期间申请的专利
附录3 攻读硕士学位期间所获的奖励
附录4 攻读硕士学位期间参加的科研项目
致谢
南京邮电大学;