声明
摘要
第1章绪论
1.1研究背景
1.2国内外研究现状
1.3本文主要工作
1.4本文组织结构
第2章相关技术概述
2.1 Hadoop简介
2.1.1分布式文件系统HDFS
2.1.2 MapReduce编程模型
2.1.3 Zookeeper
2.2 BSP模型
2.3图划分技术概述
2.3.1图的基本概念
2.3.2图划分问题描述
2.3.3典型的图划分算法及负载均衡算法介绍
2.3.4大图处理系统中图划分技术介绍
2.4本章小结
第3章BC-BSP系统及数据划分模块简介
3.1系统体系结构
3.2系统处理流程
3.3数据划分子模块
3.4离线划分结果与BC-BSP系统的耦合
3.5本章小结
第4章基于分布式内存的启发式划分算法的实现
4.1 LDG启发式规则的改进
4.1.1顶点放置收益模型
4.1.2 LDG启发式规则的局限性
4.1.3顶点输入顺序的控制
4.2 LDG划分算法的分布式设计
4.2.1全局顶点路由信息以及全局分区信息的设计
4.2.2分布式内存的设计
4.3基于分布式内存LDG划分算法的实现
4.3.1划分处理流程设计
4.3.2基于分布式内存的启发式划分的实现
4.4.4本章小结
第5章基于子图浓缩的启发式划分算法
5.2.1现有子图浓缩算法的分析
5.2.2边的介数中心性的估计
5.2.3基于高介数边删除的子图浓缩算法
5.3浓缩顶点的划分及整图还原
5.3.1集中式浓缩顶点划分
5.3.2分布式浓缩顶点划分
5.3.3浓缩图还原实现
5.5本章小结
第6章划分效果性能评估
6.1实验环境
6.2划分性能测试
6.2.1测试数据
6.2.2分区间耦合度测试
6.2.3负载均衡测试
6.2.4划分时间测试
6.2.4子图浓缩测试
6.2.5扩展性测试
6.3 PageRank测试算法
6.4系统集成测试
6.5本章小结
第7章总结与展望
7.1本文工作总结
7.2未来工作展望
参考文献
致谢
攻硕期间参加的项目