声明
摘要
第1章绪论
1.1研究背景
1.1.1分布式计算
1.1.2分布式算法
1.2目的和意义
1.3国内外研究现状
1.4主要研究内容
1.4.1 Maiter框架的负载均衡处理问题的研究
1.4.2异步累积迭代算法的研究
1.5论文章节安排
第2章DAIC模型及Maiter框架
2.1传统同步迭代计算
2.2传统异步迭代计算
2.3 DAIC计算模型
2.3.1 DAIC计算模型的前提条件
2.3.2 DAIC计算模型的推导
2.3.3 DAIC计算模型的优先级迭代
2.4 Maiter框架
2.4.1 Maiter框架的实现
2.4.2 Maiter框架的优先级迭代的实现
2.4.3 Maiter框架的API
2.5本章小结
第3章Maiter框架的负载均衡技术
3.1负载不均衡的原因
3.1.1同步框架负载不均衡的原因
3.1.2 Maiter框架负载不均衡的原因
3.2负载均衡方案的选择
3.3负载均衡处理决策算法
3.3.1决策算法设计思路
3.3.2负载均衡决策算法
3.4数据迁移
3.4.1数据迁移产生的问题
3.4.2对Maiter框架数据管理方式的改进
3.4.3数据迁移的正确性保证
3.5迁移数据重定位
3.6错位消息处理
3.6.1错位消息的产生及影响
3.6.2基于缓存的消息中转解决方案
3.6.3基于缓存的消息中转机制正确性证明
3.7负载均衡处理详细过程
3.8本章总结
第4章异步累积迭代算法
4.1研究内容介绍
4.2 SimRank算法原理与Hadoop实现
4.2.1 SimRank算法原理
4.2.2 Hadoop框架上的实现
4.3 Asyn-SimRank算法
4.3.1同步迭代-累积形式一Delta-SimRank
4.3.2异步迭代-累积形式一Asyn-SimRank
4.3.3收敛性与正确性证明
4.4关键点优先调度
4.4.1基本思想
4.4.2理论证明
4.5 Asyn-SimRank算法的分布式实现
4..5.1输入图的预处理
4.5.2分布式环境上的实现
4.6本章小结
第5章性能实验与评价
5.1负载均衡性能验证
5.1.1实验数据集及分布式环境
5.1.2负载均衡机制的有效性
5.1.3负载均衡机制的开销
5.1.4数据分块数量对系统的影响
5.2 Asyn-SimRank性能验证
5.2.1实验数据集及实验环境
5.2.2总体运行时间对比
5.2.3收敛速度对比
5.2.4通信量对比
5.2.5算法与分布式环境规模的关系
5.3本章小结
第6章总结与展望
6.1总结
6.2展望
参考文献
致谢
攻读硕士学位期间的论文和项目情况