封面
中文摘要
英文摘要
目录
第一章引言
1.1研究背景及意义
1.2研究现状及趋势
1.3研究内容
1.4论文组织结构
第二章强化学习值函数逼近概述
2.1马尔科夫决策过程
2.2值函数逼近框架
2.3值函数逼近求解方法
2.4本章小结
第三章梯度下降值函数逼近模型的改进
3.1改进的梯度下降值函数逼近模型
3.2 NRBF-GD-Sarsa(λ)算法
3.3仿真实验
3.4本章小结
第四章基于LSSVR的Q值函数分片逼近模型
4.1 LSSVR-Q值函数分片逼近模型
4.2在线稀疏化样本池构建方法
4.3 LSSVR-Q算法
4.4仿真实验
4.5本章小结
第五章基于ANRBF网络的Q-V值函数协同逼近模型
5.1 Q-V值函数协同机制
5.2 Q-V值函数协同逼近模型
5.3 Q-V值函数协同逼近算法
5.4仿真实验
5.5本章小结
第六章总结与展望
6.1总结
6.2展望
参考文献
攻读硕士学位期间发表(录用)的论文及参与的项目
致谢
苏州大学;