声明
摘要
图目录
表目录
1.1研究背景
1.2研究现状
1.2.1图对抗攻击研究现状
1.2.2迁移强化学习研究现状
1.2.3动作嵌入研究现状
1.3研究方法与研究内容
1.4文章结构安排
第2章背景技术
2.1强化学习
2.1.1基本概念
2.1.2强化学习算法
2.2迁移强化学习
2.2.1基本概念
2.2.2评价指标
2.3本章小结
第3章基于强化学习的图对抗攻击研究
3.2 GCN基本定义
3.3问题描述
3.4基于强化学习的攻击方法
3.4.1马尔科夫决策过程建模
3.4.2基于DQN的攻击算法
3.5其他攻击方法
3.5.1随机攻击方法
3.5.2基于梯度的攻击方法
3.6实验
3.6.1实验设置及数据集介绍
3.6.2指向性攻击
3.6.3攻击的迁移性
3.6.4扰动分析
3.7本章小结
第4章基于动作嵌入的策略迁移
4.2问题描述
4.3动作嵌入学习
4.3.1动作嵌人学习问题的形式化
4.3.2基于状态转移模型的动作嵌入学习方法
4.4基于动作嵌入的动作生成
4.5强化学习模型训练
4.5.2基于动作嵌人的Soft Actor-Critc
4.6策略迁移
4.6.1状态空间相同
4.6.2状态空间不同
4.7实验
4.7.1实验环境介绍
4.7.2动作嵌入的学习
4.7.3策略迁移
4.8本章小结
5.1工作总结
5.2工作展望
参考文献
致谢
浙江大学;