基于B*树和B+树融合索引的海量URL管理技术
A MANAGEMENT TECHNIQUES FOR MASS URL DATA BASED ON COMPLEX INDEX FROM B* TREE AND B+ TREE
摘 要
Abstract
目 录
第1章 绪 论
1.1 课题研究背景和意义
1.2 国内外相关研究和综述
1.3 课题研究内容
1.4 本文的结构安排
第2章 海量URL存储的关键技术分析
2.1 引言
2.2 WEB爬虫对海量URL管理的要求
2.3 海量URL管理的关键技术
2.4 本章小结
第3章 海量URL去重技术和数据存储结构研究
3.1 引言
3.2 海量URL去重技术
3.3 URL索引存储结构NP_B+Tree
3.4 NP_B+Tree存储结构的性能分析和实验
3.5 本章小结
第4章 基于缓存技术的海量URL管理方案
4.1 引言
4.2 海量URL数据的预取、缓存策略
4.3 海量URL管理系统运行优化设计
4.4 本章小结
第5章 海量URL管理系统的设计与实现
5.1 引言
5.2 URL管理系统系统的设计目标
5.3 URL管理系统的体系结构和功能模块设计
5.4 海量URL管理系统性能测试
5.5 本章小结
结 论
参考文献
哈尔滨工业大学硕士学位论文原创性声明
哈尔滨工业大学硕士学位论文使用授权书
致 谢