声明
致谢
摘要
第一章绪论
1.1课题背景与研究意义
1.2研究现状
1.2.1功能需求研究
1.2.2非功能需求研究
1.3研究内容
1.4论文结构
第二章强化学习和深度强化学习相关理论
2.1强化学习基本概念
2.1.1强化学习原理
2.1.2强化学习的几个要素
2.1.3马尔可夫决策过程
2.2强化学习常见算法
2.2.1 TD(λ)
2.2.2 Sarsa
2.2.3 Q学习
2.3深度强化学习方法
2.3.1深度学习与强化学习的结合
2.3.2深度Q学习
2.4本章小结
第三章基于Q学习的WSNs实时数据传输调度算法
3.1背景描述
3.2系统模型
3.2.1数据流模型
3.2.2马尔可夫过程描述
3.2.3 Q学习模型
3.3 RS-QL算法描述
3.3.1系统空间
3.3.2奖励机制
3.3.3探索开发策略
3.3.4算法描述
3.4仿真结果分析
3.4.1仿真参数配置
3.4.2对比算法分析
3.4.3算法性能分析
3.5本章小结
第四章基于深度Q学习的WSNs实时数据传输调度算法
4.1系统模型
4.1.1网络模型
4.1.2 Q学习模型
4.1.3 DQN网络模型
4.2 RS-DQL算法
4.2.1最优动作选取策略
4.2.2奖励机制
4.2.3状态-行为映射网络
4.2.4 RS-DQL算法描述
4.3仿真结果分析
4.3.1仿真参数配置
4.3.2对比算法分析
4.3.3算法性能分析
4.4本章小结
第五章总结和展望
5.1总结
5.2展望
参考文献
攻读硕士学位期间的学术活动及成果情况