第一个书签之前
摘 要
ABSTRACT
目 录
Contents
1 绪 论
1.1 研究目的和意义
1.2 国内外研究现状
1.2.1 LQ最优控制的研究现状
1.2.2 ADP算法的背景与研究现状
1.3 本文主要内容及章节安排
2 预备知识
2.1符号说明
2.2 BP神经网络算法的基本理论
2.3 基于BP网络的HDP算法的基本理论
3 未知平均场随机离散系统的LQ最优控制问题
3.1 问题描述及相关准备
3.2 ADP迭代方法及其收敛性证明
3.2.1 ADP迭代方法
3.2.2 收敛性证明
3.3 通过基于BP网络的HDP技术实现迭代
3.4 仿真模拟及分析
3.5 小结
4 未知斯坦克尔伯格博弈随机离散系统的LQ最优策略问题
4.1 问题描述及相关准备
4.2 迭代的ADP算法及其收敛性证明
4.2.1 迭代的ADP算法
4.2.2 收敛性分析
4.3 通过HDP技术实现迭代方程
4.4 仿真模拟及分析
4.5小结
5 总结与展望
参考文献
致 谢
攻读硕士学位期间的主要成果