声明
摘要
第1章 绪论
1.1 研究背景及意义
1.2 Deep Web数据抽取面临的主要问题
1.3 研究内容及贡献
1.3.1 研究内容
1.3.2 本文贡献
1.4 论文组织结构
第2章 Deep Web数据抽取相关研究和技术
2.1 引言
2.2 Deep Web数据抽取方法分类
2.2.1 手工实现的抽取方法
2.2.2 半自动的抽取方法
2.2.3 全自动的抽取方法
2.3 Web相关技术
2.4 视觉块树
2.5 本章小结
第3章 基于序列划分策略的列表页面数据记录抽取
3.1 引言
3.2 挖掘数据区域
3.3 数据记录的抽取
3.3.1 视觉块相似性度量
3.3.2 数据区域树下的子树聚类
3.3.3 确定数据记录
3.4 实验
3.4.1 数据集
3.4.2 实验环境
3.4.3 评价标准
3.4.4 实验结果及分析
3.5 小结
第4章 基于树匹配算法的数据项对齐
4.1 引言
4.2 数据记录预处理
4.3 树匹配算法
4.3.1 筒单树匹配
4.3.2 多重对齐
4.4 实验
4.5 小结
第5章 总结与展望
5.1 总结
5.2 展望
参考文献
致谢
攻渎学位期间发表的学术论文目录