连续状态自适应离散化基于K-均值聚类的强化学习方法

文锋; 陈宗海; 卓睿; 周光明

首页> 中文期刊> 《控制与决策》 >连续状态自适应离散化基于K-均值聚类的强化学习方法

连续状态自适应离散化基于K-均值聚类的强化学习方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

使用聚类算法对连续状态空间进行自适应离散化,得到了基于K-均值聚类的强化学习方法.该方法的学习过程分为两部分:对连续状态空间进行自适应离散化的状态空间学习,使用K-均值聚类算法;寻找最优策略的策略学习,使用替代合适迹Sarsa学习算法.对连续状态的强化学习基准问题进行仿真实验,结果表明该方法能实现对连续状态空间的自适应离散化,并最终学习到最优策略.与基于CM AC网络的强化学习方法进行比较,结果表明该方法具有节省存储空间和缩短计算时间的优点.

著录项

来源
《控制与决策》 |2006年第2期|143-147|共5页
作者
文锋; 陈宗海; 卓睿; 周光明;
展开▼
作者单位

中国科学技术大学自动化系;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动控制理论;
关键词
强化学习; K-均值聚类算法; Sarsa学习; 连续状态; 自适应离散化;

相似文献

中文文献
外文文献
专利

1. 基于节点生长k-均值聚类算法的强化学习方法 [J] . 陈宗海 ,文锋 ,聂建斌 . 计算机研究与发展 . 2006,第004期
2. 基于模糊C均值聚类的粗集理论连续属性的离散化新算法 [J] . 黄晓莉 ,曾黄麟 ,王秀碧 . 重庆邮电大学学报（自然科学版） . 2006,第005期
3. 基于距离阈值的自适应K-均值聚类算法 [J] . 曾庆山 ,张贵勇 . 郑州大学学报（理学版） . 2016,第004期
4. 一种基于动态自适应数据窗口的模糊k-均值聚类缺失数据估算算法 [J] . 廖再飞 ,吕新杰 ,罗雄飞 . 计算机研究与发展 . 2009,第0z2期
5. 基于自适应混沌变异的k-均值聚类粒子群算法 [J] . 刘淳安 ,何俊红 . 科学技术与工程 . 2009,第005期
6. 一种基于动态自适应数据窗口的模糊k-均值聚类缺失数据估算算法 [C] . 廖再飞 ,吕新杰 ,罗雄飞 . NDBC2009第26届中国数据库学术会议 . 2009
7. 改进的模糊C均值聚类与连续属性离散化算法研究 [A] . 李鑫 . 2011

连续状态自适应离散化基于K-均值聚类的强化学习方法

摘要

著录项

相似文献

相关主题

期刊订阅