一种新的基于函数逼近协同更新的DQN算法

刘青松; 陈建平; 傅启明; 高振; 陆悠; 吴宏杰

首页> 中文期刊>计算机科学 >一种新的基于函数逼近协同更新的DQN算法

一种新的基于函数逼近协同更新的DQN算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对经典深度Q网络(Deep Q-Network,DQN)算法在训练初期收敛速度慢的问题,文中提出一种新的基于函数逼近协同更新的DQN算法.该算法在经典的DQN算法的基础上融合了线性函数方法,在训练的初期利用线性函数逼近器来代替神经网络中的行为值函数网络,并提出一种离策略值函数更新规则,与DQN协同更新值函数参数,加快神经网络的参数优化,进而加快算法的收敛速度.将改进后的算法与DQN算法用于CartPole和Mountain Car问题,实验结果表明,改进后的算法具有更快的收敛速度.

著录项

来源
《计算机科学》|2020年第z1期|130-134147|共6页
作者
刘青松; 陈建平; 傅启明; 高振; 陆悠; 吴宏杰;
展开▼
作者单位

苏州科技大学电子与信息工程学院江苏苏州215009;

苏州科技大学江苏省建筑智慧节能重点实验室江苏苏州215009;

苏州科技大学电子与信息工程学院江苏苏州215009;

苏州科技大学江苏省建筑智慧节能重点实验室江苏苏州215009;

苏州科技大学电子与信息工程学院江苏苏州215009;

苏州科技大学江苏省建筑智慧节能重点实验室江苏苏州215009;

苏州科技大学电子与信息工程学院江苏苏州215009;

苏州科技大学电子与信息工程学院江苏苏州215009;

苏州科技大学电子与信息工程学院江苏苏州215009;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
强化学习; MDP; DQN; 线性函数;
入库时间 2023-07-24 19:22:47

相似文献

中文文献
外文文献
专利

1. 一种新的基于聚类决策的码本更新算法 [J] . 谢蒙 ,易法令 ,杨松润 . 计算机技术与发展 . 2013,第003期
2. 一种基于惩罚函数和新信息素更新方式的蚁群算法 [J] . 赵伟 ,蔡兴盛 ,曲慧雁 . 计算机工程与科学 . 2013,第003期
3. 一种新的基于FP-Tree的关联规则增量式更新算法 [J] . 徐文拴 ,辛运帏 . 计算机工程与设计 . 2006,第018期
4. 一种基于块回归更新的解扩重扩判决指导新算法 [J] . 杜志敏 ,万彭 ,高路 . 通信学报 . 2002,第011期
5. 一种新的基于多因素多级模糊综合评判的更新算法 [J] . 陈君 ,廖建新 ,陈俊亮 . 通信学报 . 2000,第004期
6. 基于一种新遗传算法编码方法的构件截面与构件分组的协同优化设计 [C] . 刘晓峰 ,王博 . 中国力学学会2009学术大会 . 2009
7. 一种新的图像分割算法—一种基于免疫遗传算法和粗糙集的改进图像分割算法 [A] . 张一栋 . 2008

一种新的基于函数逼近协同更新的DQN算法

摘要

著录项

相似文献

相关主题

期刊订阅