声明
摘要
第1章 引言
1.1 研究背景
1.1.1 云计算与大数据
1.1.2 大规模图的增量迭代计算
1.2 研究意义
1.2.1 大图增量迭代计算的特点与挑战
1.2.2 国内外研究现状
1.3 本文主要贡献及组织结构
1.3.1 本文主要贡献
1.3.2 本文组织结构
第2章 大图迭代计算的相关工作
2.1 大图迭代计算的分布式框架
2.1.1 基于MapReduce模型的计算框架
2.1.2 基于BSP模型的计算框架
2.1.3 其它分布式计算框架
2.2 大图的分布式划分
2.2.1 随机Hash划分算法
2.2.2 启发式划分算法
2.3 大图的磁盘存储与索引技术
2.4 大图处理的消息优化方法
2.4.1 同步迭代处理
2.4.2 异步迭代处理
2.4.3 基于Combine的消息优化方法
2.4.4 基于切分的消息优化方法
2.5 本章小结
第3章 分布式图划分与顶点连续编码技术
3.1 大图的分布式划分
3.1.1 大图的局部性分析
3.1.2 连续划分方法
3.1.3 连续划分方法分析
3.2 图顶点连续编码技术
3.2.1 基于Hadoop的连续编码方法
3.2.2 基于DHT的Hybrid-MT连续编码技术
3.2.3 顶点编号替换的代价分析
3.3 实验结果与分析
3.3.1 实验设置
3.3.2 图划分性能评估
3.4 本章小结
第4章 基于状态转换与Markov模型的磁盘索引技术
4.1 大图的增量迭代特点分析
4.1.1 经典算法分析
4.1.2 增量迭代特征
4.1.3 增量迭代的状态转换模型
4.2 大图的磁盘存储管理技术
4.2.1 基于列存储模型的静态Hash索引策略
4.2.2 基于状态转换与Markov模型的动态Hash索引策略
4.3 实验结果与分析
4.3.1 实验设置
4.3.2 索引性能评估
4.3.3 数据处理能力与处理效率评估
4.4 本章小结
第5章 增量迭代的消息优化技术
5.1 基于EBSP模型的Hybrid迭代机制
5.1.1 同步与异步迭代机制分析
5.1.2 典型算法分析
5.1.3 基于EBSP模型的Hybrid迭代机制
5.1.4 消息优化示例分析
5.2 基于连续划分的图顶点切分方法(VCCP)
5.2.1 基于连续划分的VCCP方法
5.2.2 顶点备份比例分析
5.3 实验结果与分析
5.3.1 实验设置
5.3.2 基于EBSP模型的Hybrid方法性能测试
5.3.3 基于连续划分的VCCP方法性能测试
5.4 本章小结
第6章 DiterGraph原型系统
6.1 系统简介
6.2 系统部署及使用方法
6.2.1 系统部署
6.2.2 用户编程指导
6.2.3 可视化管理工具
6.3 本章小结
第7章 总结与展望
7.1 本文的主要贡献与结论
7.2 未来工作
参考文献
致谢
攻读硕士学位期间的论文项目情况