封面
声明
中文摘要
英文摘要
目录
1 绪 论
1.1 研究目的及意义
1.2 国内外研究现状
1.3 研究目标及所做的工作
1.4 论文的组织结构
2 网页正文抽取
2.1 网页区域分割
2.2 网页正文标题提取
2.3 网页正文区域识别
2.4 实验结果与分析
2.5 本章小结
3 链接评价
3.1 网页的主题相关度计算
3.2 链接的优先度计算
3. 3 链接的分级管理
3.4 本章小结
4 聚焦爬虫实验与分析
4.1 聚焦爬虫原型系统
4.2 爬虫性能评价标准
4.3 实验方案及结果分析
4.4 本章小结
5 总结与展望
5.1 全文总结
5.2 存在的问题
5.3 研究展望
致谢
参考文献