声明
1 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 强化学习研究现状
1.2.2 深度强化学习研究现状
1.2.3 倒立摆控制研究现状
1.3 研究工作及内容安排
2 理论基础
2.1 引言
2.2 强化学习基础理论
2.2.1 强化学习基础概念
2.2.2 马尔科夫决策过程(MDP)
2.2.3 强化学习模型及四要素
2.2.4 强化学习常用算法
2.3 深度强化学习基础概念及常用算法
2.4 一级直线倒立摆基础理论
2.5 小结
3 基于深度强化学习的倒立摆平衡控制仿真实验
3.1 引言
3.2 基于DQN算法的倒立摆平衡控制仿真实验
3.3 基于双网络DQN算法的倒立摆平衡控制仿真实验
(3)实验过程说明
(4)实验结果与分析
3.4 基于PG算法的倒立摆平衡控制仿真实验
(4)实验结果及分析
3.5 小结
4 基于PLC的倒立摆硬件实验平台搭建
4.1 引言
4.2 实验平台搭建原理
4.3 基于PID的倒立摆平衡控制
4.4 小结
5 基于深度强化学习DQN算法的倒立摆起摆控制
5.1 引言
5.2倒立摆起摆过程描述
5.3 DQN算法倒立摆起摆控制
(4)实验结果与分析
5.4 小结
6 基于强化学习Q学习算法的倒立摆平衡控制
6.1 引言
6.2 Q学习算法倒立摆平衡控制
(2)实验过程说明
(3)实验结果与分析
6.3 引入经验回放的Q学习算法倒立摆平衡控制
(3)实验结果与分析
6.4 改进型Q学习算法倒立摆平衡控制
6.5 实验结果对比
6.6 小结
7 总结与展望
7.1 总结
7.2 展望
致谢
参考文献
西安理工大学;