首页> 中文期刊>电机与控制学报 >一类连续状态与动作空间下的加权Q学习

一类连续状态与动作空间下的加权Q学习

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对连续状态与动作空间下的控制问题,提出了一类连续状态与动作空间下的加权Q学习算法,应用改进的增长神经气算法动态构建径向基网络的隐含层,实现状态空间的自适应构建.在基于径向基网络实现的标准Q学习基础上,利用加权Q学习算法用以解决具有连续动作输出的控制问题.仿真实例验证了所提算法的有效性.

著录项

来源
《电机与控制学报》|2005年第6期|570-574|共5页
作者
程玉虎; 易建强; 王雪松; 赵冬斌;
展开▼
作者单位

中国矿业大学,信息与电气工程学院,江苏,徐州,221008;

中国科学院自动化研究所,复杂系统与智能科学实验室,北京,100080;

中国矿业大学,信息与电气工程学院,江苏,徐州,221008;

中国科学院自动化研究所,复杂系统与智能科学实验室,北京,100080;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动控制、自动控制系统;
关键词
连续状态空间; 连续动作空间; 加权Q学习; 神经气算法; 径向基网络;
入库时间 2023-07-25 18:42:43

相似文献

中文文献
外文文献
专利

1. 基于支持向量机的连续状态空间Q学习 [J] . 王雪松 ,田西兰 ,程玉虎 . 中国矿业大学学报 . 2008,第1期
2. 连续空间中的一种动作加权行动者评论家算法 [J] . 刘全 ,章鹏 ,钟珊 . 计算机学报 . 2017,第006期
3. 一类MIMO系统连续状态空间模型的参数辨识频域方法 [J] . 鲁兴举 ,郑志强 . 自动化学报 . 2016,第001期
4. 一类诱导广义有序加权对数的连续区间有序加权调和平均算子及其应用 [J] . 张超 ,袁宏俊 . 延边大学学报（自然科学版） . 2017,第004期
5. 基于自组织模糊RBF网络的连续空间Q学习 [J] . 程玉虎 ,王雪松 ,易建强 . 信息与控制 . 2008,第1期
6. 一类连续动作空间下的Q-learning [C] . 程玉虎 ,易建强 ,赵冬斌 . 中国自动化与信息技术研讨会暨2004年学术年会 . 2004
7. 连续状态—动作空间下强化学习方法的研究 [A] . 程玉虎 . 2005

获取原文

客服邮箱：kefu@zhangqiaokeyan.com

京公网安备：11010802029741号 ICP备案号：京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有

客服微信
服务号