首页> 中文学位 >基于强化学习的影响力最大化研究
【6h】

基于强化学习的影响力最大化研究

代理获取

目录

声明

第一章 绪 论

1.1 研究工作的背景与意义

1.2 影响力最大化问题的国内外研究历史与现状

1.3 本文的主要贡献与创新

1.4 本论文的结构安排

第二章 理论基础

2.1 信息传播模型

2.1.1 独立级联模型

2.1.2 线性阈值模型

2.2 强化学习

2.2.1 马尔科夫决策过程

2.2.2 强化学习算法基本结构

2.3 博弈论

2.3.1 博弈论理论基础

2.3.2 纳什均衡

2.3.3 最佳应对与占优策略

2.3.4 随机博弈

2.3.5 网络协调博弈

2.4 本章小结

第三章 单智能体影响力最大化问题

3.1 适用的强化学习算法调查分析

3.1.1 基于Q表的强化学习算法

3.1.2 基于参数的强化学习算法

3.2 单智能体影响力最大化问题的马尔科夫决策过程

3.2.1 为基于Q表的强化学习算法建立马尔科夫决策过程

3.2.2 为基于参数的强化学习算法建立马尔科夫决策过程

3.3 单智能体影响力最大化问题实验

3.3.1 使用基于Q表的强化学习算法实验结果及分析

3.3.2 使用基于参数的强化学习算法实验结果及分析

3.3.3 强化学习算法与经典算法对比实验

3.4 本章小结

第四章 多智能体影响力最大化问题

4.1.1 基于Self-play的DQN算法简介

4.1.2 为基于Self-play的DQN算法建立马尔科夫决策过程

4.1.3 使用基于Self-play的DQN算法进行实验

4.2 使用Nash Q Learning算法的解决方案

4.2.1 Nash Q Learning算法简介

4.2.2 为Nash Q Learning算法建立马尔科夫决策过程

4.2.3 使用Nash Q Learning算法进行实验

4.3 使用Nash DQN算法的解决方案

4.3.1 Nash DQN算法简介

4.3.2 为Nash DQN算法建立马尔科夫决策过程

4.3.3 使用Nash DQN算法进行实验

4.4 本章小结

第五章 全文总结与展望

5.1 全文总结

5.2 未来工作展望

致谢

参考文献

攻读研究生学位期间取得的成果

展开▼

著录项

  • 作者

    董涵;

  • 作者单位

    电子科技大学;

  • 授予单位 电子科技大学;
  • 学科 计算机科学与技术
  • 授予学位 硕士
  • 导师姓名 郝东;
  • 年度 2020
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号