首页> 中文学位 >基于多智能体深度强化学习的大规模路口信号灯协同控制研究

【6h】

基于多智能体深度强化学习的大规模路口信号灯协同控制研究

代理获取

页面导航

目录
著录项
相似文献
相关主题

目录

声明

致谢

第一章绪论

1.1 课题研究背景及意义

1.2 国内外研究现状

1.2.1路口交通控制应用及研究现状

1.2.2深度强化学习研究现状

1.2.3 强化学习针对信号灯控制的研究现状

1.3 本文主要研究内容

第二章大规模路口信号灯协同控制问题的建模

2.1 相关概念简介

2.1.1 马尔可夫决策过程

2.1.2 回报

2.1.3 价值函数

2.1.4 强化学习算法

2.2 多智能体系统模型

2.2.1 信号灯决策与交通流耦合机理分析

2.2.2 交通系统建模

2.2.3 交通系统仿真模型搭建

2.3 基于马尔可夫决策过程的问题建模

2.3.1 状态空间建模

2.3.2 动作空间建模

2.3.3 奖励函数建模

2.4 智能体交互框架搭建

2.5 本章小结

第三章信号灯决策问题下的多智能体深度强化学习训练

3.1 引言

3.2 动态环境下基于价值的离线学习

3.2.1带经验回放的Double-DQN

3.2.2 基于Double-DQN的离线学习框架

3.3 动态环境下基于策略的离线学习

3.3.1 基于Soft-Actor-Critic的学习方法

3.3.2基于LSTM的深度神经网络改进

3.3.3 基于Soft-Actor-Critic信号灯决策离线学习

3.4 仿真验证与结果分析

3.4.1 训练算法分析

3.4.2离线学习交通流优化验证分析

3.5 本章小结

第四章基于多智能体系统的贪婪决策顺序及应用

4.1 引言

4.2 基于信号灯控制域的贪婪决策顺序

4.3 贪婪决策顺序在多智能体协同决策上的应用

4.4 仿真验证与分析

4.4.1改进算法训练分析

4.4.2改进算法的交通流优化效果

4.5 本章小结

第五章总结与展望

5.1 总结

5.2 展望

参考文献

攻读硕士学位期间的学术活动及成果情况

展开▼

著录项

作者
汪天祥;
展开▼
作者单位

合肥工业大学;

展开▼
授予单位合肥工业大学;
学科车辆工程
授予学位硕士
导师姓名钱立军,钱德猛;
年度 2021
页码
总页数
原文格式 PDF
正文语种 chi
中图分类 U49U41;
关键词

相似文献

中文文献
外文文献
专利

1. 基于深度强化学习的无信号灯交叉路口车辆控制 [J] . 欧阳卓 ,周思源 ,吕勇 . 计算机科学 . 2022,第3期
2. 基于在线学习的单路口信号灯强化学习控制 [J] . 徐岗财 ,丁旭 . 山西科技 . 2005,第005期
3. 基于深度强化学习的道路信号灯控制算法 [J] . 高航 ,王伟光 . 计算机仿真 . 2021,第010期
4. 基于深度强化学习的交通信号灯控制 [J] . 李涛 ,李慧滢 ,王怡萱 . 信息与电脑 . 2021,第010期
5. 基于深度强化学习的交通信号灯控制 [J] . 陈树德 ,彭佳汉 ,高旭 . 现代计算机（专业版） . 2020,第003期
6. 基于强化学习的智能体避障研究 [C] . YING Xiao-kun ,应小昆 ,PANG Yi . 第九届中国多智能体系统与控制会议（MASC2013） . 2014
7. 大规模场景下基于加权平均场的多智能体深度强化学习研究 [A] . 吴斌 . 2021

代理获取

客服邮箱：kefu@zhangqiaokeyan.com

京公网安备：11010802029741号 ICP备案号：京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有

客服微信
服务号