基于权重值的竞争深度双Q网络算法

汪晨曦; 赵学艳; 郭新

首页> 中文期刊> 《南京信息工程大学学报：自然科学版》 >基于权重值的竞争深度双Q网络算法

基于权重值的竞争深度双Q网络算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

在深度强化学习中,深度Q网络算法存在严重高估动作值问题,使得智能体的表现不尽人意.尽管深度双Q网络和竞争网络结构可以部分缓解高估带来的影响,但引入双Q网络的同时,有时也会低估动作值.本文提出了一种基于权重值的竞争深度双Q网络算法(Weighted Dueling Double Deep Q-Network,WD3QN),把改进的双估计器及竞争网络结构结合至深度Q网络中,将学习到的可能动作值进行加权产生最终动作值,有效减少估计误差.最后,将算法应用于Open AI Gym平台上的CartPole经典控制问题,仿真结果显示:与已有算法对比,本算法有更好的学习效果,收敛性和训练速度均有提升.

著录项

来源
《南京信息工程大学学报：自然科学版》 |2021年第5期|564-570|共7页
作者
汪晨曦; 赵学艳; 郭新;
展开▼
作者单位

华南理工大学自动化科学与工程学院;

广州510641;

广东交通职业技术学院;

机电工程学院;

广州510650;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动控制、自动控制系统;
关键词
深度强化学习; 深度双Q网络; 竞争网络结构; 权重值;

相似文献

中文文献
外文文献
专利

1. 融合动作剔除的深度竞争双Q网络智能干扰决策算法 [J] . 饶宁 ,许华 ,宋佰霖 . 空军工程大学学报（自然科学版） . 2021,第004期
2. 基于深度双Q网络的多用户蜂窝网络功率分配算法研究 [J] . 王伟 ,殷爽爽 . 计算机应用研究 . 2021,第005期
3. 基于双值韦伯算子的深度置信网络表情识别算法 [J] . 郝晓丽 ,田苗 . 中北大学学报（自然科学版） . 2017,第006期
4. 基于时间权重值的共识算法研究 [J] . 王日宏 ,袁杉杉 ,徐泉清 . 计算机应用研究 . 2021,第011期
5. 一种基于RSSI的权重值选择及加权定位算法 [J] . 杨萍 ,李智 . 太赫兹科学与电子信息学报 . 2012,第002期
6. 基于深度神经网络算法的VoLTE语音质量评估方法与应用 [C] . 马越 . 辽宁省通信学会2019年度学术年会 . 2019
7. 基于双深度网络的视觉目标跟踪算法研究 [A] . 石书林 . 2018

基于权重值的竞争深度双Q网络算法

摘要

著录项

相似文献

相关主题

期刊订阅