致谢
第一章 绪论
1.1 本课题的研究背景及意义
1.2 国内外的研究现状及发展趋势
1.2.1 智能电网故障监测技术相关研究
1.2.2 资源分配与调度算法相关研究
1.3.1 论文主要研究内容
1.3.2 论文章节安排
第二章 深度强化学习算法基础理论
2.1.1 深度学习简介
2.1.2 深度学习工作原理
2.1.3 深度学习的应用
2.2 强化学习概述
2.2.1 强化学习简介
2.2.2 强化学习基本模型和原理
2.2.3 强化学习算法分类
2.3 深度强化学习简介
2.3.1 深度强化学习简介
2.3.2 深度强化学习原理框架
2.3.3 常见的深度强化学习算法
2.3.4 深度强化学习相关应用
2.4 本章小结
第三章 基于深度强化学习的组合优化问题的求解框架
3.1 指针网络
3.1.1 Seq2seq模型
3.1.2 指针网络
3.2 Actor-Critic算法框架
3.2.1 策略梯度方法
3.2.2 Actor-Critic框架
3.3 二维分组背包问题的求解
3.3.1 背包问题介绍
3.3.2 指针网络应用于二维分组背包的求解
3.3.3 仿真实验与分析
3.4 本章小结
第四章 基于深度强化学习的资源分配和调度算法研究
4.1 系统模型
4.2 轻量级神经网络
4.3 系统延迟分析
4.3.1 无线通信延迟分布
4.3.2 互联网延迟分布
4.3.3 总延迟分布
4.4 问题建模
4.5 智能电网故障监测系统的资源分配和调度方法研究
4.5.1 注意力机制的修改
4.5.2 问题重构
4.5.3 基于策略梯度进行优化
4.6 仿真实验与分析
4.6.1 仿真及参数配置
4.6.2 真实实验
4.7 本章小结
第五章 总结与展望
5.1 论文总结
5.2 工作展望
参考文献
攻读硕士学位期间发表的学术成果
合肥工业大学;