封面
中文摘要
英文摘要
目录
1 绪 论
1.1选题背景及研究意义
1.2研究现状及难点问题
1.3主要研究内容
1.4论文的组织和安排
2 相关理论与技术
2.1网络爬虫基本原理
2.2主题爬虫工作流程
2.3主题描述
2.4网页预处理
2.5本章小结
3 基于页面内容评价的Best-First算法
3.1概述
3.2 Best-First算法
3.3 改进Best-First算法
3.4本章小结
4 实验及结果分析
4.1评价标准
4.2实验分析
4.3本章小结
5 总结和展望
5.1 总结
5.2展望
致谢
参考文献
附录 A. 作者在攻读学位期间发表的论文目录