首页> 中文学位 >基于强化学习的WSNs实时数据传输调度算法研究
【6h】

基于强化学习的WSNs实时数据传输调度算法研究

代理获取

目录

声明

致谢

摘要

第一章绪论

1.1课题背景与研究意义

1.2研究现状

1.2.1功能需求研究

1.2.2非功能需求研究

1.3研究内容

1.4论文结构

第二章强化学习和深度强化学习相关理论

2.1强化学习基本概念

2.1.1强化学习原理

2.1.2强化学习的几个要素

2.1.3马尔可夫决策过程

2.2强化学习常见算法

2.2.1 TD(λ)

2.2.2 Sarsa

2.2.3 Q学习

2.3深度强化学习方法

2.3.1深度学习与强化学习的结合

2.3.2深度Q学习

2.4本章小结

第三章基于Q学习的WSNs实时数据传输调度算法

3.1背景描述

3.2系统模型

3.2.1数据流模型

3.2.2马尔可夫过程描述

3.2.3 Q学习模型

3.3 RS-QL算法描述

3.3.1系统空间

3.3.2奖励机制

3.3.3探索开发策略

3.3.4算法描述

3.4仿真结果分析

3.4.1仿真参数配置

3.4.2对比算法分析

3.4.3算法性能分析

3.5本章小结

第四章基于深度Q学习的WSNs实时数据传输调度算法

4.1系统模型

4.1.1网络模型

4.1.2 Q学习模型

4.1.3 DQN网络模型

4.2 RS-DQL算法

4.2.1最优动作选取策略

4.2.2奖励机制

4.2.3状态-行为映射网络

4.2.4 RS-DQL算法描述

4.3仿真结果分析

4.3.1仿真参数配置

4.3.2对比算法分析

4.3.3算法性能分析

4.4本章小结

第五章总结和展望

5.1总结

5.2展望

参考文献

攻读硕士学位期间的学术活动及成果情况

展开▼

著录项

  • 作者

    吴文生;

  • 作者单位

    合肥工业大学;

  • 授予单位 合肥工业大学;
  • 学科 计算机科学与技术
  • 授予学位 硕士
  • 导师姓名 张本宏;
  • 年度 2019
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类
  • 关键词

    强化学习; 实时; 数据传输调度;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号