封面
声明
中文摘要
目录
目录
1 引言
1.1 研究背景和意义
1.2 国内外研究现状
1.3 本文主要研究问题
1.4 本文章节安排
2 相关技术介绍
2.1 HTML 和 DOM
2.2 解析 HTML 的工具
2.3 手工抽取方法
2.4 网页的视觉特征
2.5 小结
3 基于视觉信息和 DOM 树的数据抽取
3.1 问题描述
3.2 定位数据区域
3.3 抽取数据记录
3.4 对齐数据项
3.5 实验结果与分析
3.6 小结
4 系统集成及其它问题
4.1 系统集成
4.2 系统设计中的其它问题
4.3 小结
5 总结和展望
5.1 总结
5.2 展望
参考文献
致谢
个人简历
已发表的学术论文
研究项目
中国海洋大学;