第一章 绪论
1.1 优化控制理论研究的发展历史
1.2 非线性系统优化控制的研究现状
1.3 深度强化学习的主要理论和方法
1.3.1 深度学习
1.3.2 强化学习
1.3.3 深度强化学习
1.4 基于深度强化学习求解优化控制问题的研究现状
1.5 本文的创作动机和结构安排
第二章 基于LDI神经网络的非线性系统自适应优化控制
2.1 问题描述
2.2 神经网络线性微分包含
2.3 非线性系统线性化处理
2.4 新的神经网络强化学习算法实现
2.4.1 在线策略迭代算法
2.4.2 算法的稳定性
2.4.3 算法的收敛性
2.4.4 算法实现
2.5 数值仿真
2.5.1 例1
2.5.2 例2
2.6 本章小结
第三章 基于生成式对抗网络的非线性系统自适应优化控制
3.1 问题描述
3.2 连续时间策略迭代算法
3.3 Q-学习算法
3.4 新的深度强化学习算法
3.4.1 生成式对抗网络
3.4.2 RL-GANs算法
3.4.3 网络的稳定性
3.4.4 算法的收敛性
3.5 数值仿真
3.5.1 模型构建
3.5.2 实验结果
3.6 本章小结
第四章 基于深度元强化学习的非线性系统自适应优化控制
4.1 问题描述
4.2 预测代价的元学习
4.3 编码-解码器
4.4 新的深度元强化学习算法
4.4.1 训练算法流程
4.4.2 测试算法流程
4.4.3 算法实现
4.5 实验结果
4.6 本章小结
第五章 总结与展望
5.1 本文的主要工作及贡献
5.2 前景与展望
5.3 类脑控制模型构想
参考文献
攻读学位期间发表的学术论文
致谢
安徽大学;