封面
声明
目录
中文摘要
英文摘要
第一章绪论
1 .1论文研究的背景和意义
1 .2国内外研究现状
1 .3存在的问题
1 .4本文的工作
1 .5论文的结构
第二章当前网络爬虫技术研究
2 .1网络爬虫概述
2 .2网络爬虫的基本流程
2 .3当前网络爬虫技术分类
2 .4正则表达式技术
2.5 XML路径语言XPath
2 .6本章小结
第三章基于Naive Bayes分类器的网页去噪方法研究
3.1 Naive Bayes分类器概述
3.2 Naive Bayes分类器工作流程
3.3 Naive Bayes分类器在本系统中的应用
3 .4本章小结
第四章系统需求分析
4 .1定向爬虫面临的主要困难
4 .2系统目标和解决的问题
4 .3系统需求概述
4 .4本章小结
第五章基于Naive Bayes算法的定向爬虫系统设计
5 .1系统设计目标
5 .2系统总体设计
5 .3系统详细设计
5 .4数据库设计
5 .5本章小结
第六章系统实现与测试
6 .1开发环境
6 .2系统主要模块的实现
6 .3基于Naive Bayes算法的定向爬虫系统演示
6 .4系统测试
6 .5本章小结
第七章总结与展望
7.1全文总结
7 .2不足与展望
参考文献
致谢