首页> 中文期刊>计算机科学 >一种新的基于函数逼近协同更新的DQN算法

一种新的基于函数逼近协同更新的DQN算法

     

摘要

针对经典深度Q网络(Deep Q-Network,DQN)算法在训练初期收敛速度慢的问题,文中提出一种新的基于函数逼近协同更新的DQN算法.该算法在经典的DQN算法的基础上融合了线性函数方法,在训练的初期利用线性函数逼近器来代替神经网络中的行为值函数网络,并提出一种离策略值函数更新规则,与DQN协同更新值函数参数,加快神经网络的参数优化,进而加快算法的收敛速度.将改进后的算法与DQN算法用于CartPole和Mountain Car问题,实验结果表明,改进后的算法具有更快的收敛速度.

著录项

  • 来源
    《计算机科学》|2020年第z1期|130-134147|共6页
  • 作者单位

    苏州科技大学电子与信息工程学院 江苏 苏州215009;

    苏州科技大学江苏省建筑智慧节能重点实验室 江苏 苏州215009;

    苏州科技大学电子与信息工程学院 江苏 苏州215009;

    苏州科技大学江苏省建筑智慧节能重点实验室 江苏 苏州215009;

    苏州科技大学电子与信息工程学院 江苏 苏州215009;

    苏州科技大学江苏省建筑智慧节能重点实验室 江苏 苏州215009;

    苏州科技大学电子与信息工程学院 江苏 苏州215009;

    苏州科技大学电子与信息工程学院 江苏 苏州215009;

    苏州科技大学电子与信息工程学院 江苏 苏州215009;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 信息处理(信息加工);
  • 关键词

    强化学习; MDP; DQN; 线性函数;

  • 入库时间 2023-07-24 19:22:47

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号