声明
摘要
第1章 绪论
1.1 研究背景
1.2 国内外研究现状
1.3 本文主要工作
1.4 本文组织结构
第2章 相关技术概述
2.1 Hadoop简介
2.1.1 分布式文件系统
2.1.2 MapReduce编程模型
2.1.3 Zookeeper
2.2 BSP模型
2.2.1 BSP模型介绍
2.2.2 BSP模型特点及评价
2.3 图划分技术概述
2.3.1 图的基本概念
2.3.2 图划分问题描述
2.3.3 经典的图划分算法及负载均衡算法介绍
2.3.4 大图处理系统中图划分技术介绍
2.4 本章小结
第3章 BC-BSP系统及数据划分模块简介
3.1 系统体系结构
3.2 系统处理流程
3.3 数据划分子模块
3.4 本章小结
第4章 基于采样直方图的数据划分算法
4.1 算法概述
4.2 直方图和Trie树的创建
4.2.1 基于采样的直方图的创建
4.2.2 Trie树的创建
4.3 Sample划分算法
4.3.1 算法详述
4.3.2 Sample划分算法复杂度分析
4.4 采样量的确定
4.5 实验与分析
4.5.1 参数确定
4.5.2 负载均衡测试
4.6 本章小结
第5章 针对出度的均衡Hash划分 算法
5.1 经典随机Hash划分算法介绍
5.2 BSP作业运行的代价模型
5.3 实现负载均衡的Hash数据划分算法
5.3.1 BHP划分算法简介
5.3.2 BHP戈U分算法详述
5.3.3 BHP划分算法复杂度分析
5.4 边聚簇的BHP数据划分算法
5.4.1 EC启发式规则
5.4.2 ECBHP划分算法详述
5.4.3 ECBHP划分算法复杂度分析
5.5 BHP和ECBHP划分算法与随机Hash算法的性能分析
5.6 实验与分析
5.6.1 分区扩大倍数测试
5.6.2 负载均衡测试
5.7 本章小结
第6章 划分算法在BC-BSP系统的性能评估
6.1 PageRank测试算法
6.2 实验环境和测试数据
6.3 不同划分算法的性能评估
6.3.1 通信代价测试
6.3.2 时间测试
6.4 本章小结
第7章 总结与展望
7.1 本文工作总结
7.2 未来工作展望
参考文献
致谢
攻硕期间发表的论文和参加的项目
东北大学;