首页> 中文期刊> 《计算机仿真》 >基于模拟退火策略的Sarsa强化学习方法

基于模拟退火策略的Sarsa强化学习方法

     

摘要

针对传统强化学习算法(如Sarsa算法)收敛速度缓慢的问题,提出了基于模拟退火策略的Sarsa(SA-Sarsa)算法.在策略选择上使用模拟退火策略替代ε-greedy策略,利用退火速率控制算法的收敛速度,有效克服了Sarsa算法直接通过随机数与贪婪值比较选择策略而导致的陷入局部最优解的问题,达到了保证最优解、提高收敛速度的目的.通过迷宫的路径规划问题仿真,将SA-Sarsa算法与Q-Learning和Sarsa两种传统算法进行了对比,实验表明,SA-Sarsa学习算法在取得同等最优解下探索效率高且收敛速度更快.

著录项

  • 来源
    《计算机仿真》 |2019年第4期|219-222,228|共5页
  • 作者单位

    中国人民解放军陆军工程大学指挥信息系统学院;

    江苏南京210000;

    中国人民解放军陆军工程大学指挥信息系统学院;

    江苏南京210000;

    中国人民解放军陆军工程大学指挥信息系统学院;

    江苏南京210000;

    中国人民解放军陆军工程大学指挥信息系统学院;

    江苏南京210000;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 计算机仿真;
  • 关键词

    强化学习; 算法; 模拟退火; 迷宫仿真;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号