封面
中文摘要
英文摘要
目录
1 绪论
1.1 课题研究背景与研究意义
1.2 国内外研究现状
1.3 研究方法
1.4 本文的主要工作
1.5 本章小结
2 本文相关理论与技术
2.1 HTML技术介绍
2.2 CSS技术介绍
2.3 HTML Parser
2.4 Web文档结构相似性算法
2.5 本章小结
3 Deep Web页面的标签特征和视觉特征分析
3.1 标签特征
3.2 视觉特征
3.3 本章小结
4 Deep Web页面内容结构提取
4.1 Tag-Tree噪声节点过滤
4.2 视觉块聚类
4.3 本章小结
5 Deep Web查询结果页面rich-content area提取
5.1 查询页面和查询结果页面的比较
5.2 rich-content area的提取
5.3 本章小结
6 实验结果与分析
6.1 树型相似性算法的实验结果
6.2 内容结构提取的实验结果
6.3 核心内容域提取的实验结果
6.4 本章小结
7 总结和展望
7.1 本文总结
7.2 展望
致谢
参考文献
重庆大学;