首页> 中国专利> 一种基于记忆网络的深度强化学习交通信号控制方法

一种基于记忆网络的深度强化学习交通信号控制方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种基于记忆网络的深度强化学习交通信号控制方法，包括：1、建立基于DQN算法的交通信号灯控制主网络和目标值网络；主网络将t时刻状态值st输入LSTM中得到t+1时刻预测状态值合并st和并输入全连接网络，得到预测Q值的最大值和对应动作2、初始化算法参数，采集路况信息建立状态值st；3、将st输入主网络得到预测Q值取最大值的动作采用1‑ε策略选择动作at；4、执行动作at并计算奖励rt和状态st+1；5、在经验池中随机抽样B个记录，通过最小化损失函数训练主网络参数；6、定时更新目标值网络参数，根据当前路况更新st，跳转至步骤3继续执行。该方法根据当前路况以及对当前路况的预测来计算Q值，能够更精确地对交通信号进行控制。

著录项

公开/公告号CN114613168A

专利类型发明专利
公开/公告日2022-06-10

原文格式PDF
申请/专利权人南京信息工程大学;
展开▼

申请/专利号CN202210408279.1
发明设计人孔燕;卢学亮;
展开▼

申请日2022-04-19
分类号G08G1/08;G08G1/01;G06N3/08;G06N3/04;
代理机构南京苏高专利商标事务所(普通合伙);
代理人常虹
地址 210044 江苏省南京市江北新区宁六路219号
入库时间 2023-06-19 15:36:51

法律信息

法律状态公告日

法律状态信息

法律状态
2022-06-10

公开

发明专利申请公布

相似文献

专利
中文文献
外文文献

1. 一种基于图深度强化学习的自适应交通信号控制方法 [P] . 中国专利： CN114627657A . 2022-06-14
2. 一种基于深度强化学习的交通信号控制方法 [P] . 中国专利： CN112216124B . 2021.07.27
3. 一种基于集成学习的工业控制系统入侵检测方法 [P] . 世界知识产权组织专利： WO2020/143226A1 . 2020.07.16
4. 控制信息发送方法、接收方法、终端及网络侧设备 [P] . 世界知识产权组织专利： WO2020/143755A1 . 2020.07.16
5. 一种功率控制的方法以及功率控制的装置 [P] . 世界知识产权组织专利： WO2020/143514A1 . 2020.07.16