增强学习算法的性能测试与对比分析

李兆斌; 徐昕; 吴军; 连传强

首页> 中文期刊> 《计算机应用研究》 >增强学习算法的性能测试与对比分析

增强学习算法的性能测试与对比分析

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

研究了几类典型增强学习算法的性能评估问题,包括Q-学习算法、最小二乘策略迭代(LSPI)和基于核的最小二乘策略迭代 (KLSPI)算法等,重点针对Markov决策问题(MDP)的值函数平滑特性对算法性能的影响进行了研究.分别利用值函数非平滑的组合优化问题--旅行商问题(TSP)和值函数平滑的Mountain-Car运动控制问题,对不同增强学习算法的性能进行了测试和比较分析.分析了三种算法针对不同类型问题的各自特点,通过实验对比,验证了近似策略迭代算法,特别是KLSPI算法在解决值函数平滑的序贯决策问题时性能更优.通过分析实验结果表明,MDP值函数的平滑程度是影响近似策略迭代算法性能表现的重要因素.

著录项

来源
《计算机应用研究》 |2010年第10期|3662-36653669|共5页
作者
李兆斌; 徐昕; 吴军; 连传强;
展开▼
作者单位

国防科学技术大学;

机电工程与自动化学院;

自动化研究所;

长沙;

410073;

国防科学技术大学;

机电工程与自动化学院;

自动化研究所;

长沙;

410073;

国防科学技术大学;

机电工程与自动化学院;

自动化研究所;

长沙;

410073;

国防科学技术大学;

机电工程与自动化学院;

自动化研究所;

长沙;

410073;

展开▼
原文格式 PDF
正文语种 chi
中图分类安全保密;
关键词
增强学习; 值函数; 近似策略迭代; 平滑性;

相似文献

中文文献
外文文献
专利

1. 联合支持向量机和增强学习算法的多波束声学底质分类 [J] . 纪雪 ,唐秋华 ,陈义兰 . 测绘学报 . 2021,第007期
2. 基于深度增强学习的VVC码率控制算法 [J] . 徐艺文 ,刘航 ,黄景泉 . 中国科技论文 . 2021,第007期
3. 基于增强学习算法的云资源动态弹性伸缩 [J] . 张继东 ,曹靖城 ,周帅 . 信息技术 . 2021,第008期
4. 基于深度增强学习的VVC码率控制算法 [J] . 徐艺文 ,刘航 ,黄景泉 . 中国科技论文 . 2021,第007期
5. 基于深度增强学习的网络数据包分类算法研究 [J] . 郭鹏 . 佳木斯大学学报（自然科学版） . 2020,第002期
6. 增强学习与深度增强学习算法综述 [C] . WANG Chao ,王超 ,ZHANG Xudong . 第十四届全国信号和智能信息处理与应用学术会议 . 2021
7. 基于深度增强学习的360度视频动态自适应请求算法及工程平台实现 [A] . 刘文龙 . 2021

增强学习算法的性能测试与对比分析

摘要

著录项

相似文献

相关主题

期刊订阅