首页> 中文期刊> 《智能系统学报》 >增强学习中的直接策略搜索方法综述

增强学习中的直接策略搜索方法综述

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

对增强学习中各种策略搜索算法进行了简单介绍,建立了策略梯度方法的理论框架,并且根据这个理论框架的指导,对一些现有的策略梯度算法进行了推广,讨论了近年来出现的提高策略梯度算法收敛速度的几种方法,对于非策略梯度搜索算法的最新进展进行了介绍,对进一步研究工作的方向进行了展望.

著录项

来源
《智能系统学报》 |2007年第1期|16-24|共9页
作者
王学宁; 陈伟; 张锰; 徐昕; 贺汉根;
展开▼
作者单位

国防科技大学;

机电工程与自动化学院;

湖南;

长沙;

410073;

国防科技大学;

机电工程与自动化学院;

湖南;

长沙;

410073;

北京清河大楼;

子9;

北京;

100085;

国防科技大学;

机电工程与自动化学院;

湖南;

长沙;

410073;

国防科技大学;

机电工程与自动化学院;

湖南;

长沙;

410073;

展开▼
原文格式 PDF
正文语种 chi
中图分类机器人;
关键词
增强学习; 策略搜索; 策略梯度;

相似文献

中文文献
外文文献
专利

1. 直接搜索方法在空调温度控制中的应用 [J] . 李宗利 ,赵威 ,王健 . 装备学院学报 . 2008,第005期
2. 电力电子变流器中的直接功率控制策略研究综述 [J] . 李宁 ,王跃 ,雷万钧 . 电源学报 . 2013,第001期
3. 永磁同步电动机直接转矩控制策略综述 [J] . 李正熙 ,王占扩 ,杨立永 . 变频器世界 . 2006,第011期
4. PFC直接电流控制策略综述 [J] . 王传兵 ,李玉玲 ,张仲超 . 电源技术应用 . 2005,第007期
5. 交流电机直接转矩控制策略综述 [J] . 李永东 . 变频器世界 . 2004,第004期
6. 增强学习与深度增强学习算法综述 [C] . WANG Chao ,王超 ,ZHANG Xudong . 第十四届全国信号和智能信息处理与应用学术会议 . 2021
7. 雾计算中基于混合智能增强学习自动机的资源调度策略研究 [A] . 王晓 . 2019

获取原文

客服邮箱：kefu@zhangqiaokeyan.com

京公网安备：11010802029741号 ICP备案号：京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有

客服微信
服务号