声明
第 1 章绪论
1.1研究背景及意义
1.2研究现状
1.3主要研究工作
1.4论文的组织结构
1.5本章小结
第 2 章星际争霸Ⅱ 智能体开发平台及相关算法介绍
2.2 星际争霸Ⅱ 智能体开发平台
2.3 星际争霸智能体算法
2.4 本章小结
第 3 章 星际争霸Ⅱ宏观动作预测算法研究
3.1数据预处理
3.2.1基础特征
3.2.2 统计特征
3.3 输入数据预处理
3.4 LSTM模型结构设计
3.5.1 模型参数分析
3.5.2 LSTM 模型与其他算法对比
3.6 本章小结
第 4 章基于宏观动作预测的深度强化学习算法研究
4.1.1深度强化学习
4.1.2 PPO算法
4.2 深度强化学习智能体的基本架构
4.3 将LSTM模型应用到PPO中
4.4 奖励函数的设置
4.5 实验设置
4.6实验结果与分析
4.6.1 预训练LSTM网络对强化学习的影响
4.6.2 不同奖励值设定下的结果对比
4.6.3 使用课程学习训练智能体
4.7本章小结
第5 章星际争霸Ⅱ 智能体的构建
5.1.1 ProductionManager 完善
5.1.2 CombatCommander 完善
5.2 算法集成到智能体
5.3 StarCraft 2 AI Ladder 测试
5.4 本章小结
总结与展望
致谢
参考文献
附录
攻读硕士学位期间发表的论文
西南交通大学;