摘要
研究目的及意义
国内外研究现状
本文的创新点
本文的组织结构
3.1DeepWeb数据集成机制
3.1.1DeepWeb数据集成技术
3.1.2两种DeepWeb数据集成机制
3.1.3科技文献异构数据库共享检索平台中的集成机制确定
3.2DeepWeb数据集成关键技术
3.2.1DeepWeb数据的特点
3.2.2DeepWeb数据抽取方法
3.2.3DeepWeb页面与DOM树的对应
3.2.4查询结果排序处理技术
3.3一种基于DOM树匹配的DeepWeb自动抽取算法
3.3.1算法主要思想
3.3.2DOM树匹配计算算法
3.3.3数据区域识别算法
3.3.4抽取规则生成
3.3.5实验分析
3.4一种基于Lucene的改进排序算法
3.4.1算法主要思想
3.4.2词和文档的位置关系度量
3.4.3基于Lucene的改进排序算法
3.4.4实验分析
4.1DeepWeb异构数据集成解决方案
4.1.1项目建设的需求
4.1.2项目的技术难点和关键问题分析
4.1.3开发技术架构
4.1.4科技文献的异构数据集成框架
4.2基于DOM树匹配的DeepWeb抽取算法实现
4.2.1设计原理及目标
4.2.2系统设计结构
4.2.3抽取子系统工作流程
4.2.4自动抽取方法的实现
4.3基于Lucene的改进排序算法实现
4.3.1整合流程
4.3.2改进的排序算法算法的实现
4.4相关平台对比
4.4.1项目使用情况
4.4.1检索性能对比
4.4.2综合对比
4.5系统运行部分截图
5.1本文研究工作总结
5.2下一步工作展望
贵州大学;