声明
摘要
第一章 绪论
1.1 WEB结构化数据抽取和集成的目的和意义
1.1.1 研究的目的
1.1.2 研究的意义
1.2 国内外研究现状
1.2.1 国外研究现状
1.2.2 国内研究现状
1.3 相关背景知识
1.3.1 WEB数据挖掘与集成概述
1.3.2 相关理论与技术
1.4 本文的主要工作
1.5 论文结构
第二章 基于领域模型的数据抽取与集成
2.1 WEB表结构数据分析
2.1.1 WEB表格
2.1.2 WEB表格分类
2.2 WEB数据模型与模式
2.3 领域数据模型
2.4 WEB数据抽取与集成
2.4.1 系统结构
2.4.2 基于领域模型的数据抽取和集成方法
2.5 本章小结
第三章 实体扩充
3.1 实体扩充概述
3.2 实体扩充
3.2.1 实体扩充模型
3.2.2 实体间相似性的计算
3.2.3 质量评估
3.2.4 实体扩充算法
3.2.5 静态阈值算法
3.2.6 动态阈值算法
3.3 本章小结
第四章 属性扩充
4.1 属性扩充概述
4.2 属性扩充系统框架概述
4.2.1 训练阶段概述
4.2.2 部署阶段概述
4.3 约束
4.3.1 实体约束
4.3.2 类别约束
4.4 属性值分配
4.4.1 本地模型
4.4.2 分类器训练
4.5 本章小结
第五章 实验结果
5.1 评估标准介绍
5.2 实验背景
5.3 实验结果
5.4 本章小结
第六章 总结
6.1 本文总结
6.2 今后的研究工作
参考文献
作者简介
致谢
沈阳建筑大学;