声明
致谢
摘要
第1章引言
1.1课题研究背景及意义
1.2国内外研究现状
1.2.1驾驶培训
1.2.2元胞自动机
1.2.3强化学习
1.3本文研究内容及章节安排
第2章驾驶培训过程分析
2.1引言
2.2驾校学员
2.3驾校教练
2.3.1真人教练
2.3.2机器人教练
2.4本章小结
第3章驾校学员与车元胞自动机模型
3.1引言
3.2元胞自动机基本概念介绍
3.3基于元胞自动机的驾校学员与车模型
3.3.1元胞空间
3.3.2元胞状态
3.3.3元胞邻居
3.3.4元胞演化规则
3.4仿真结果与分析
3.4.1无教练教学的仿真
3.4.2有教练教学的仿真
3.4.3与真人练车数据对比
3.5本章小结
第4章驾校教练强化学习决策模型
4.1引言
4.2强化学习算法
4.2.1基本概念
4.2.2策略探索
4.2.3常见算法
4.3基于强化学习的驾校教练决策模型
4.3.1驾校教练决策模型的马尔可夫决策过程分析
4.3.2基于策略迭代算法训练驾校教练决策模型
4.3.3基于Q-learning算法训练驾校教练决策模型
4.4驾校教练强化学习决策模型仿真实验与分析
4.4.1基于策略迭代算法训练的驾校教练决策模型仿真
4.4.2基于Q-learning算法训练的驾校教练决策模型仿真
4.4.3仿真结果分析
4.5本章小结
第5章总结与展望
5.1总结
5.2展望
参考文献
研究成果
浙江大学;