声明
缩略语表
第一章 绪论
1.1 研究背景与意义
1.2 研究现状
1.2.1 填充式和覆盖式
1.2.2 被动模式和主动模式
1.2.3 基于优化问题和基于博弈问题
1.3 主要研究内容
1.4 论文结构安排
第二章 相关理论和工作基础
2.1.1 概述
2.1.2 神经元模型
2.1.3 神经网络结构
2.1.4 正向传播过程
2.1.5 反向传播算法
2.1.6 激活函数
2.1.7 优化算法
2.2 强化学习
2.2.1 概述
2.2.2 马尔科夫决策过程
2.2.3 动态规划算法
2.2.4 蒙特卡罗方法
2.2.5 时序差分算法
2.3 深度强化学习
2.4 本章总结
第三章 智能功率控制算法模型
3.1 场景描述
3.2 系统模型
3.2.1 服务质量
3.2.2 传感器测量
3.2.3 主用户的功率更新
3.2.4 次用户的功率更新
3.3 基于Q-学习方法的系统求解
3.3.1 可行性分析
3.3.2 四元组说明
3.3.3 算法设计
3.4 系统模型的改进
3.5 基于深度强化学习方法的系统求解
3.5.1 必要性分析
3.5.2 算法设计
3.5.3 收敛性说明
3.5.4 同步性说明
3.6 本章总结
第四章 模型算法实现及分析
4.1 基于Q-学习方法的实验验证
4.1.1 实验参数设计
4.1.2 实验结果及分析
4.2 深度学习库Tensorflow
4.3 基于深度强化学习方法的实验验证
4.3.1 实验参数设计
4.3.2 实验结果及分析
4.3.3 对比实验
4.4 本章总结
第五章 总结与展望
5.1 全文总结
5.2 未来展望
致谢
参考文献
攻读硕士学位期间的研究成果