声明
第 1 章 绪 论
1.1 研究背景和意义
1.2 国内外研究现状
1.2.1 社交网络垃圾用户检测
1.2.2 隐私保护技术
1.2.3 差分隐私与分类挖掘方法的结合
1.3 研究内容
1.4 论文组织结构
第 2 章 基础理论与相关技术介绍
2.1 新浪微博垃圾用户
2.2.1 隐私保护度
2.2.2 隐私保护中的几个属性
2.2.3 差分隐私保护的相关概念
2.2.4 实现机制
2.3.1 决策树算法简介
2.3.2 随机森林算法简介
2.3.3 AdaBoost算法简介
2.4 本章小结
第 3 章 微博数据集构建和垃圾用户特征分析选择
3.1 引言
3.2 微博数据获取
3.2.1 自动切换IP代理部分
3.2.2 数据获取部分
3.3.1 特征预处理
3.3.2 缺失值处理
3.4 微博数据集标注
3.5 特征选择和分析
3.5.1 用户个人信息特征分析与选择
3.5.2 用户微博内容特征分析与选择
3.6 实验结果
3.6.1 基于随机森林的特征优选算法
3.6.2 实验结果
3.7 本章小结
第 4 章 基于改进的差分隐私随机森林算法
4.1 引言
4.2 评分函数的设计
4.3 基于差分隐私的C4.5算法
4.4.1 DP-C4.5算法
4.4.2 隐私性分析
4.5.1 基于特征贡献度的隐私预算分配
4.5.2 DP-RFS算法
4.5.3 隐私性分析
4.6.1 验证数据集
4.6.2 算法评价指标
4.7.1 实验准备
4.7.2 实验结果与分析
4.8 本章小结
第 5 章 基于改进的差分隐私AdaBoost算法
5.1 引言
5.2 基于改进的差分隐私AdaBoost算法
5.2.1 DP-AdaBoost算法
5.2.2 隐私性分析
5.3 验证数据集与算法评价指标
5.4.1 实验准备
5.4.2 结果与分析
5.5 本章小结
结论与展望
工作总结
未来展望
致谢
参考文献
攻读硕士学位期间发表的论文及科研成果
西南交通大学;