文摘
英文文摘
第1章.概述
1.1网页搜索器简介
1.2网页数据维护
1.3本文的组织
第2章.相关研究
第3章.网页数据更新
3.1网页变化模型
3.2网页变化频率分类
3.3域名特征
3.4动静态特征
3.5缓存特征
3.6改进的分类方法
3.7分类器训练过程
3.8更新过程
第4章.镜像网页处理
4.1近似镜像网页检测算法
4.2网页评分
4.3近似镜像网页祛除算法
第5章.系统结构与实现
5.1体系结构
5.2相关实现
5.3界面
第6章.实验与评测
6.1实验环境与配置
6.2基本运行数据
6.3镜像祛除算法评测
6.4变化频率分类算法评测
第7章.总结与讨论
7.1总结
7.2讨论
参考文献
附录.其余模块的设计与实现
后记
原创性声明