声明
摘要
第1章 绪论
1.1 课题研究的目的和意义
1.2 国内外研究现状
1.3 本文研究的主要内容
1.4 论文组织结构
第2章 社交平台下垃圾信息过滤技术概述
2.1 微博传播的特性
2.2 过滤垃圾微博方法
2.2.1 用户举报人工审核
2.2.2 基于规则和模式匹配的过滤方法
2.2.3 基于统计机器学习的过滤方法
2.3 统计学习理论的过滤方法框架
2.4 机器学习方法
2.4.1 逻辑回归
2.4.2 支持向量机
2.4.3 随机森林
2.5 实验数据集以及评价指标
2.6 本章小结
第3章 面向微博过滤的特征设计
3.1 用户行为特征
3.1.1 社交网络关系图
3.1.2 关注、好友、用户名誉度
3.1.3 微博中的信息传递
3.1.4 信息传播图的生成
3.2 用户内容特征
3.2.1 提及与话题标签
3.2.2 URL特征
3.2.3 文本相似性特征
3.2.4 时间间隔与发布平台
3.2.5 转发与评论特征
3.3 数据分析
3.4 实验评价
3.5 本章小结
第4章 基于在线主动学习的垃圾微博检测
4.1 基于在线学习的垃圾微博过滤框架
4.2 在线机器学习方法
4.2.1 在线逻辑回归算法
4.2.2 在线支持向量机算法
4.3 在线主动学习
4.3.1 b-Sampling采样方法
4.3.2 逻辑间隔的采样方法
4.3.3 固定间隔采样方法
4.4 实验评价
4.5 本章小结
第5章 社交网络中僵尸账号检测的研究
5.1 微博中的僵尸账号
5.2 序贯概率比检验
5.3 僵尸账号检测问题的形式化
5.4 微博僵尸检测框架
5.5 实验评价
5.6 本章小结
结论
参考文献
攻读硕士学位期间发表的学术论文
致谢