封面
声明
中文摘要
英文摘要
目录
专用术语注释表
第一章 绪论
1.1研究的背景及意义
1.2国内外研究现状
1.3论文的组织结构
第二章 Web结构挖掘和分布式计算
2.1链接分析简介
2.2 PageRank算法简介
2.3 HITS算法简介
2.4其他链接分析算法
2.5分布式计算
2.6本章小结
第三章 PageRank算法的优化
3.1主题漂移现象优化
3.2网页权值平均化现象优化
3.3侧重旧网页现象优化
3.4用户兴趣无关性现象优化
3.5 I-PR算法实验分析
3.6本章小结
第四章 分布式I-PR算法
4.1数据的预处理
4.2 Map函数处理
4.3 Combine过程
4.4 Reduce函数处理
4.5分布式平台搭建
4.6实验
4.7本章小结
第五章 总结与展望
5.1本文的工作总结
5.2进一步工作展望
参考文献
致谢