首页> 中文期刊> 《智能系统学报》 >增强学习中的直接策略搜索方法综述

增强学习中的直接策略搜索方法综述

         

摘要

对增强学习中各种策略搜索算法进行了简单介绍,建立了策略梯度方法的理论框架,并且根据这个理论框架的指导,对一些现有的策略梯度算法进行了推广,讨论了近年来出现的提高策略梯度算法收敛速度的几种方法,对于非策略梯度搜索算法的最新进展进行了介绍,对进一步研究工作的方向进行了展望.

著录项

  • 来源
    《智能系统学报》 |2007年第1期|16-24|共9页
  • 作者单位

    国防科技大学;

    机电工程与自动化学院;

    湖南;

    长沙;

    410073;

    国防科技大学;

    机电工程与自动化学院;

    湖南;

    长沙;

    410073;

    北京清河大楼;

    子9;

    北京;

    100085;

    国防科技大学;

    机电工程与自动化学院;

    湖南;

    长沙;

    410073;

    国防科技大学;

    机电工程与自动化学院;

    湖南;

    长沙;

    410073;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 机器人;
  • 关键词

    增强学习; 策略搜索; 策略梯度;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号