基于分块链接的网页排序并行算法设计与实现
DESIGN AND IMPLEMENTATION OF BLOCK-LEVEL LINK BASED PARALLEL WEB PAGE RANKING ALGORITHM
摘 要
Abstract
绪论
1.1 课题背景
1.2 本课题研究的目的及意义
1.3 国内外相关技术发展现状
1.3.1 搜索引擎相关技术介绍
1.3.2 网页链接排序算法研究现状
1.3.3 网页分块提取技术研究现状
1.3.4 并行处理技术的发展现状
1.4 本文主要研究内容及组织
并行网页排序相关技术
2.1 引言
2.2 分块链接提取技术
2.2.1 分块链接介绍
2.2.2 网页结构的提取
2.2.3 网页链接的特点
2.3 链接排序算法
2.3.1 PageRank算法
2.3.2 HITS算法
2.3.3 PageRank算法和HITS算法比较
2.4 并行计算技术
2.4.1 并行体系结构介绍
2.4.2 主要并行编程模型
2.4.3 MPI技术
2.5 本章小结
并行网页排序系统的设计
3.1 系统的设计目标
3.2 系统总体设计
3.3 分块链接的提取和存储
3.3.1 分块链接提取
3.3.2 url的语法解析过滤
3.3.3 网页链接的存储
3.3.4 并行分块链接提取
3.4 改进的PageRank算法
3.5 网页排序并行算法设计与实现
3.5.1 串行的改进PageRank算法
3.5.2 并行的改进PageRank算法的设计
3.6 本章小结
实验结果与分析
4.1 引言
4.2 实验环境
4.3 分块链接提取实验
4.3.1 网页分块的提取
4.3.2 链接的提取
4.3.3 并行分块链接提取
4.4 并行的改进PageRank算法实验
4.4.1 并行算法的效率
4.4.2 排序结果的准确性
4.5 本章小结
结 论
参考文献
攻读学位期间发表的学术论文
哈尔滨工业大学硕士学位论文原创性声明
哈尔滨工业大学硕士学位论文使用授权书
致 谢