首页> 中文期刊> 《计算机应用研究》 >增强学习算法的性能测试与对比分析

增强学习算法的性能测试与对比分析

         

摘要

研究了几类典型增强学习算法的性能评估问题,包括Q-学习算法、最小二乘策略迭代(LSPI)和基于核的最小二乘策略迭代 (KLSPI)算法等,重点针对Markov决策问题(MDP)的值函数平滑特性对算法性能的影响进行了研究.分别利用值函数非平滑的组合优化问题--旅行商问题(TSP)和值函数平滑的Mountain-Car运动控制问题,对不同增强学习算法的性能进行了测试和比较分析.分析了三种算法针对不同类型问题的各自特点,通过实验对比,验证了近似策略迭代算法,特别是KLSPI算法在解决值函数平滑的序贯决策问题时性能更优.通过分析实验结果表明,MDP值函数的平滑程度是影响近似策略迭代算法性能表现的重要因素.

著录项

  • 来源
    《计算机应用研究》 |2010年第10期|3662-36653669|共5页
  • 作者单位

    国防科学技术大学;

    机电工程与自动化学院;

    自动化研究所;

    长沙;

    410073;

    国防科学技术大学;

    机电工程与自动化学院;

    自动化研究所;

    长沙;

    410073;

    国防科学技术大学;

    机电工程与自动化学院;

    自动化研究所;

    长沙;

    410073;

    国防科学技术大学;

    机电工程与自动化学院;

    自动化研究所;

    长沙;

    410073;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 安全保密;
  • 关键词

    增强学习; 值函数; 近似策略迭代; 平滑性;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号