声明
摘要
第一章 绪论
1.1 研究背景和意义
1.2 国内外相关研究与应用现状
1.2.1 传统社区发现算法研究现状
1.2.2 重叠社区发现算法研究现状
1.3 研究内容
1.4 论文内容的组织
第二章 相关理论基础
2.1 相关理论
2.1.1 社交网络与图
2.1.2 社交网络中的社区结构
2.1.3 社交网络中的距离与相似性度量
2.2 标签传播算法
2.2.1 标签传播算法
2.2.2 改进的标签传播算法
2.3 Spark分布式平台
2.3.1 Spark简介
2.3.2 SparkRDD及其设计思想
2.3.3 GraphX简介
2.4 本章小结
第三章 基于概率和相似度的并行标签传播方法
3.1 K-Shell分解方法
3.2 基于概率和相似度的标签传播方法
3.3 基于概率和相似度的并行标签传播方法
3.3.1 图的构造及邻居信息收集
3.3.2 结合位置索引和邻居索引计算节点权重
3.3.3 节点问的传播概率及相似度计算
3.3.4 节点标签初始化
3.3.5 标签传播和标签选择
3.4 PSPLPA的效率分析
3.5 实验设计以及结果分析
3.5.1 实验数据集
3.5.2 评价标准
3.5.3 结果分析
3.6 本章小结
第四章 基于权重和随机游走的并行标签传播方法
4.1 随机游走的概念和相似度计算方式
4.2 基于权重和随机游走的标签传播算法
4.3 基于权重和随机游走的并行标签传播算法
4.4 时间复杂度分析
4.5 实验设计以及结果分析
4.5.1 真实网络数据集
4.5.2 人造网络数据集
4.6 本章小结
第五章 结束语
5.1 总结
5.2 展望
参考文献
作者简介
致谢