封面
声明
中文摘要
英文摘要
目录
1 引言
1.1 研究背景和意义
1.2 Web 信息抽取技术的发展
1.3 本文研究内容及创新点
1.4 本论文的组织
2 决策树分类算法
2.1 决策树简介
2.2 决策树的评估
2.3 WEKA 工具描述
2.4 小结
3 机器学习与规则融合的列表页面抽取
3.1 网页的视觉特征
3.2 Deep Web 页面的视觉化表示
3.3 页面分割算法 VIPS 的概述与应用
3.4 数据区域的自动定位
3.5 数据项的对齐并输出
3.6 小结
4 列表页面自动抽取系统
4.1 系统简介
4.2 小结
5 总结与展望
5.1 总结
5.2 展望未来的工作
参考文献
致谢
个人简历
发表的论文
科研成果