文摘
英文文摘
第一章 绪论
1.1 研究背景
1.2 研究现状
1.2.1 国外研究现状
1.2.2 国内研究现状
1.3 论文研究内容
1.4 论文结构安排
第二章 Deep Web数据挖掘概述
2.1 Deep Web定义
2.2 Deep Web数据源发现
2.2.1 Deep Web数据源难以发现的原因
2.2.2 Deep Web数据源发现的途径
2.2.3 Deep Web数据源发现相关技术
2.3 Deep Web数据集成框架
2.4 HTML基础知识
2.4.1 HTML概念
2.4.2 HTML表单
2.5 本章小结
第三章 基于特征词复合权重的关联网页分类方法
3.1 引言
3.2 关联规则基本概念
3.3 网页预处理
3.3.1 网页的表示模型
3.3.2 词频统计
3.3.3 特征词的复合权重
3.4 基于特征词复合权重的关联网页分类算法
3.5 实验结果与分析
3.5.1 实验数据及处理
3.5.2 分类性能评价指标
3.5.3 实验结果及分析
3.6 本章小结
第四章 基于决策树和链接相似的查询接口判定方法
4.1 引言
4.2 Deep Web查询接口
4.2.1 Deep Web表单
4.2.2 查询接口特征抽取
4.3 基于决策树的Deep Web查询接口预判定
4.3.1 决策树概念
4.3.2 基于决策树的预判定
4.4 基于链接相似的查询接口二次判定
4.4.1 链接相似基本概念
4.4.2 查询接口二次判定
4.5 实验结果与分析
4.5.1 实验数据及阈值参数分析
4.5.2 实验结果及分析
4.6 本章小结
第五章 Deep Web垂直搜索引擎设计
5.1 背景
5.2 系统总体设计
5.2.1 系统框架
5.2.1 系统功能
5.3 核心模块
5.3.1 图书查询接口发现模块
5.3.2 信息检索模块
5.4 系统实现
5.4.1 开发环境
5.4.2 功能演示界面
5.5 本章小结
第六章 总结与展望
6.1 总结
6.2 展望
参考文献
致谢
攻读硕士学位期间发表的论文