文摘
英文文摘
声明及关于学位论文使用授权的说明
第一章绪论
1.1选题背景及意义
1.2国内外研究现状
1.3本文的工作与创新
1.4论文的组织
1.5本章小结
第二章Web页面结构分析
2.1 HTML介绍
2.1.1 HTML组成
2.1.2 HTML结构树
2.2 XML和XHTML
2.2.1可扩展标记语言XML
2.2.2可扩展超文本标记语言XHTML
2.3本章小结
第三章DOM树结构的研究与设计
3.1 DOM技术研究
3.2 DOM树结构设计
3.3 DOM树结构操作
3.4本章小结
第四章网页清洗技术的研究与设计
4.1网页清洗技术
4.2网页清洗步骤
4.3网页清洗技术设计
4.4本章小结
第五章基于Web的HTML网页清洗工具的设计与实现
5.1系统需求分析
5.2系统总体设计
5.3系统详细设计
5.3.1基于HTTP协议的Web代理服务器的设计与实现
5.3.2基于DOM的HTML网页解析
5.3.3 HTML页面清洗算法设计与实现
5.4系统实现
5.4.1开发环境
5.4.2系统界面
5.5实验结果
5.6本章小结
第六章总结与展望
参考文献
致谢
在学期间发表的学术论文和参加科研情况