首页> 中文学位 >Deep Web自适应跨领域查询策略研究
【6h】

Deep Web自适应跨领域查询策略研究

代理获取

目录

声明

摘要

第1章 引言

1.1 课题背景

1.2 国内外研究现状

1.3 本文研究的内容

1.4 本文研究思路及组织结构

第2章 相关概念与技术

2.1 HTML

2.1.1 HTML语言

2.1.2 HTML表单

2.2 文档对象模型

2.2.1 DOM模型的定义

2.2.2 HTML文档节点的DOM表示与操作

2.3 WordNet介绍

2.3.1 WordNet概述

2.3.2 WordNet中的名词

2.4 词语相似度

2.5 本章小结

第3章 自适应跨领域查询系统框架

3.1 Web数据库内容抽样

3.2 领域相关性模型

3.3 查询路径推荐

3.3.1 数据源质量综合评估

3.3.2 多因素决策的模糊评估模型

3.4 本章小结

第4章 Deep Web领域关联关系发现

4.1 领域关联关系的提出

4.2 领域相关性模型

4.2.1 数据源相关度计算

4.2.2 基于相关度的领域关联关系发现

4.2.3 领域相关性模型构建

4.3 本章小结

第5章 Deep Web查询路径推荐

5.1 问题分析

5.2 查询树模型

5.2.1 查询树构建

5.2.2 查询路径获取

5.3 查询路径影响因素分析

5.4 面向跨领域查询的查询路径综合评估模型(QPEM)

5.5 Top-k路径推荐

5.6 本章小结

第6章 实验与分析

6.1 实验环境

6.2 评价标准

6.3 实验结果及分析

6.3.1 实验结果

6.3.2 实验结果分析

6.4 本章小结

第7章 总结与展望

7.1 本文主要工作

7.2 下一步工作

参考文献

致谢

攻硕期间科研及发表论文情况

展开▼

摘要

随着Web信息的激增,Web服务器维护的数据库即Deep Web存储的信息越来越多,以尽可能自动的方式实现对在线数据库中信息的有效访问是目前Deep Web数据集成的主要目标。
  目前互联网中包含了大量的不同领域的Deep Web数据源,面向领域的数据集成技术也日臻成熟,出现了很多面向某一特定领域的Deep Web数据集成系统。本文假设所有的Deep Web数据源已经按照领域分好类,每一个类是所有该领域的Deep Web数据源的集成,具有统一的全局访问接口。目前,随着Deep Web应用的增多,用户跨领域查询已成为一种迫切的需求,本文要研究的是如何基于这些不同领域的集成类协助用户完成跨领域查询。
  针对这个问题,本文提出了一种自适应跨领域查询方法,具体来说包括(1)通过分析数据源查询接口属性名和后台Web数据库内容计算数据源间相关度,根据数据源间的相关度判定不同领域之间的关联性,基于领域关联性,构建领域相关性模型,获得领域关联图;(2)当用户查询到达时,基于领域关联图,构建查询树,根据数据源间的关联度获取用户跨领域查询路径,提出一个跨领域查询的查询路径综合评估模型(QPEM)对查询路径进行质量评估,推荐每关联领域对内top-k查询路径来满足用户多种可能的查询意图。
  本文以Web数据库的采样样本为选择数据库的依据,即首先根据Web数据库的样本选择满足用户查询的Web数据库,之后再对选择出的Web数据库进行真正的查询,从而使查询代价降低。另外,计算数据源内容相关度也是基于Web数据库样本来计算的。基于多因素决策的模糊评价模型提出的面向跨领域查询的查询路径评估模型(QPEM),从领域间数据源的关联度、查询树中父节点中数据源质量、父节点中数据源出度和子节点中数据源质量以及数据源的入度五个指标对查询路径进行综合评估。
  经过实验验证,本文提出的数据源关联性挖掘方法具有很高的准确率,同时针对查询路径的推荐结果,将四种标准化方法就用户满意度进行对比,研究了查询覆盖率对用户满意度的影响,实验结果表明本文方法对于跨领域查询路径推荐很有效。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号