声明
摘要
第1章 绪论
1.1 研究背景
1.2 问题的提出及意义
1.3 本文主要的工作
1.4 本文组织结构
第2章 Web数据库采样方法概述
2.1 Web数据库采样方法
2.1.1 双层伯努利模型
2.1.2 Hidden-DB-Sampler
2.1.3 WDB-Sampler
2.1.4 Probability-Based-Sampler
2.1.5 NU-HDB-Sampler
2.1.6 Keyword-Based-DB-Sampler
2.2 Deep Web数据提取方法
2.3 Web信息抽取技术
2.4 中文分词技术
2.5 本章小结
第3章 一种新的Web数据库采样方法-RFSampler
3.1 相关符号定义及预备知识
3.2 采样方法的评价体系
3.2.1 样本质量
3.2.2 采样代价
3.3 系统模型
3.3 系统流程
3.4.1 预处理阶段
3.4.2 查询条件的生成
3.4.3 采样终止条件
3.4.4 采样方法评价
3.5 本章小结
第4章 基于属性相关度的查询模式
4.1 相关概念
4.2 相关工作
4.3 属性相关度
4.4 查询模式
4.5 基于属性相关度的查询模式
4.6 本章小结
第5章 基于词频-属性值相关度的查询条件生成策略
5.1 相关概念
5.2 相关工作
5.3 词频分析
5.4 属性值相关度
5.5 基于词频-属性值相关度的查询条件生成策略
5.6 本章小结
第6章 实验分析及总结
6.1 验结果及分析
6.1.1 实验的硬件和软件
6.1.2 实验结果及分析
6.3 本章小结
第7章 结论
参考文献
致谢
攻读硕士学位期间发表的论文和参加的项目