基于一维卷积循环神经网络的深度强化学习算法

畅鑫; 李艳斌; 田淼; 陈苏逸; 杜宇峰; 赵研

首页> 中文期刊> 《计算机测量与控制》 >基于一维卷积循环神经网络的深度强化学习算法

基于一维卷积循环神经网络的深度强化学习算法

AI论文写作 >>

开具论文收录证明 >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

针对现有深度强化学习算法在状态空间维度大的环境中难以收敛的问题,提出了在时间维度上提取特征的基于一维卷积循环网络的强化学习算法;首先在深度Q网络(DQN,deep Q network)的基础上构建一个深度强化学习系统;然后在深度循环Q网络(DRQN,deep recurrent Q network)的神经网络结构基础上加入了一层一维卷积层,用于在长短时记忆(LSTM,long short-term memory)层之前提取时间维度上的特征;最后在与时序相关的环境下对该新型强化学习算法进行训练和测试;实验结果表明这一改动可以提高智能体的决策水平,并使得深度强化学习算法在非图像输入的时序相关环境中有更好的表现。

著录项

来源
《计算机测量与控制》 |2022年第1期|258-265|共8页
作者
畅鑫; 李艳斌; 田淼; 陈苏逸; 杜宇峰; 赵研;
展开▼
作者单位

中国电子科技集团公司第五十四研究所;

石家庄050081;

河北省电磁频谱认知与管控重点实验室;

石家庄050081;

电子科技大学信息与通信工程学院;

成都611731;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动推理、机器学习;
关键词
强化学习; 深度学习; 长短时记忆网络; 卷积神经网络; 深度Q网络;

相似文献

中文文献
外文文献
专利

1. 基于图像卷积神经网络的匝道控制深度强化学习算法研究 [J] . 戴昇宏 ,李志斌 . 道路交通与安全 . 2019,第004期
2. 基于深度强化学习和循环卷积神经网络的图像恢复算法 [J] . 杨海清 ,徐勇军 ,王明雪 . 高技术通讯 . 2019,第005期
3. 基于图像卷积神经网络的匝道控制深度强化学习算法研究 [J] . 戴昇宏1 ,李志斌1 . 交通工程 . 2019,第004期
4. 基于卷积循环神经网络深度学习的短期风速预测 [J] . 李大中 ,李颖宇 ,王超 . 电力科学与工程 . 2019,第008期
5. 基于3D卷积深度强化学习的交通灯配时优化技术研究 [J] . 沈国庆 . 科学与信息化 . 2021,第003期
6. 基于深度强化学习的无人艇航行控制 [C] . 张法帅 ,李宝安 ,阮子涛 . 2018 年计量测试技术交流会 . 2018
7. 基于深度卷积循环神经网络的刀具状态监测技术研究 [A] . 陈炳旭 . 2019

基于一维卷积循环神经网络的深度强化学习算法

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅