声明
致谢
摘要
第一章 绪论
1.1 研究背景
1.2 研究现状
1.2.1 国内外强化研究学习现状
1.2.2 NPC AI设计行业现状
1.3 研究内容
1.3.2 研究贡献
1.4 文章结构
第二章 深度强化学习理论基础
2.1 强化学习模型与符号约定
2.2 通用解法
2.2.2 基于模型的动态规划法
2.2.3 蒙特卡罗方法(Monte Carlo method)
2.2.4 时间差分法(Temporal-Difference Learning)
2.2.5 值函数近似
2.3 深度学习基础
2.3.1 常见激活函数
2.3.2 全连接网络(Fully Connected Networks)
2.3.3 卷积神经网络(Convolutlonal Neural Networks)
2.3.4 循环神经网络(Recurrent Neural Networks)
2.4 深度强化学习
2.4.1 DEEP Q-LEARNING NETWORK
第三章 DQN在游戏中的应用
3.1 问题背景介绍
3.1.1 职业血河介绍
3.1.2 职业神相介绍
3.2 DQN模型配置
3.2.1 血河技能配置
3.2.2 神相与DQN算法设置
3.3 仿真平台——《MiniGame》
第四章 分布式DQN系统及DQN算法改进
4.1 分布式DQN系统
4.2 原始算法改进
4.2.1 批优先级经验池-BPDQN
4.2.2 模仿学习-DQFD
第五章 多样性AI训练算法与最终效果展示
5.1 多样性AI算法-H-ART-DQN
5.2 实验结果与分析
第六章 总结和展望
6.1 总结
6.2 展望
参考文献
个人成果
个人简历