首页> 中文学位 >基于深度强化学习的非线性系统自适应优化控制
【6h】

基于深度强化学习的非线性系统自适应优化控制

代理获取

目录

第一章 绪论

1.1 优化控制理论研究的发展历史

1.2 非线性系统优化控制的研究现状

1.3 深度强化学习的主要理论和方法

1.3.1 深度学习

1.3.2 强化学习

1.3.3 深度强化学习

1.4 基于深度强化学习求解优化控制问题的研究现状

1.5 本文的创作动机和结构安排

第二章 基于LDI神经网络的非线性系统自适应优化控制

2.1 问题描述

2.2 神经网络线性微分包含

2.3 非线性系统线性化处理

2.4 新的神经网络强化学习算法实现

2.4.1 在线策略迭代算法

2.4.2 算法的稳定性

2.4.3 算法的收敛性

2.4.4 算法实现

2.5 数值仿真

2.5.1 例1

2.5.2 例2

2.6 本章小结

第三章 基于生成式对抗网络的非线性系统自适应优化控制

3.1 问题描述

3.2 连续时间策略迭代算法

3.3 Q-学习算法

3.4 新的深度强化学习算法

3.4.1 生成式对抗网络

3.4.2 RL-GANs算法

3.4.3 网络的稳定性

3.4.4 算法的收敛性

3.5 数值仿真

3.5.1 模型构建

3.5.2 实验结果

3.6 本章小结

第四章 基于深度元强化学习的非线性系统自适应优化控制

4.1 问题描述

4.2 预测代价的元学习

4.3 编码-解码器

4.4 新的深度元强化学习算法

4.4.1 训练算法流程

4.4.2 测试算法流程

4.4.3 算法实现

4.5 实验结果

4.6 本章小结

第五章 总结与展望

5.1 本文的主要工作及贡献

5.2 前景与展望

5.3 类脑控制模型构想

参考文献

攻读学位期间发表的学术论文

致谢

展开▼

著录项

  • 作者

    王成龙;

  • 作者单位

    安徽大学;

  • 授予单位 安徽大学;
  • 学科 控制工程
  • 授予学位 硕士
  • 导师姓名 何舒平;
  • 年度 2020
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号