首页> 中文学位 >基于语义相关性的XML关键字查询的研究与实现
【6h】

基于语义相关性的XML关键字查询的研究与实现

代理获取

目录

文摘

英文文摘

声明

致谢

1 引言

1.1 研究背景

1.2 研究现状

1.3 本文完成的工作

1.4 论文的组织结构

2 XML关键字查询基础

2.1 XML基本概念

2.1.1 XML概述

2.1.2 XML相关技术规范和标准

2.1.3 XML的功能与应用

2.2 XML Query查询模式

2.2.1 XML数据查询方法简介

2.2.2 XML查询语言XPath

2.2.3 XML查询语言标准XQuery

2.3 XML关键字查询的相关技术

2.3.1 树型结构

2.3.2 Dewey编码

2.3.3 SLCA问题

2.3.4 XML片段的相似性度量

2.3.5 关系数据库存储XML文件

2.4 本章小结

3 基于语义相关性的XML关键字查询

3.1 问题描述

3.2 语义和实体子树

3.2.1 XML数据模型

3.2.2 实体子树

3.2.3 节点的语义三元组

3.3 语义相关性

3.3.1 关键字的环境语义

3.3.2 扩展语义的关键字查询用例

3.3.3 SEKQC中的主关键字

3.3.4 关键字匹配节点的语义相关性

3.4 查询算法描述

3.5 基于语义相关性的XML关键字查询的实现

3.5.1 查询示例系统结构

3.5.2 XML文件的解析

3.5.3 关系存储表的设计

3.5.4 查询算法的具体实现

3.6 算法实例

3.7 本章小结

4 实验结果及分析

4.1 实验方法

4.1.1 数据集描述

4.1.2 实验方法描述

4.1.3 有效性测试实验

4.1.4 效率测试实验

4.2 实验结论

5 总结与展望

参考文献

展开▼

摘要

在网络技术飞速发展的同时,web上涌现出的数据也呈指数级增长.XML逐渐成为互联网上描述和交换信息的标准格式,广泛应用于电子商务、数字图书馆等应用实例和产品.XML文档集检索的有效性成为研究一个重要方向. XML关键字查询近年来成为XML数据检索的一个研究热点.相较于XML查询语言,如XQUery等,XML关键字查询有其独特的优势.用户不需要额外学习复杂的查询语言,也不需要深入了解查询信息的内部底层结构,只需要提供相关内容的关键字就可以实现数据的检索.同时XML关键字检索以元素为粒度进行,结果只返回包含用户提供的全部关键字的XML文档片段,提高了检索的速度. 论文的主要研究内容如下:将XML树中实体节点和属性节点类比于数据库中E-R模型的实体和属性,提出实体子树的概念,并将实体子树做为语义相关单元的基本元素,定义了标识节点语义信息的语义三元组,从而将关键字和特定的环境语义关联在一起,用户提前确定关键字的语义,可以提高查询结果与用户查询意图相匹配的几率,将关键字分为主关键字和从关键字,在查询过程中过滤从关键字,仅保留主关键字可以减少查询的范围,提高查询的效率.在XML关键字查询过程中定义了关键字匹配节点间的语义相关性,通过寻找关键字的相关语义单元提高了查询结果的语义相关性.在上述内容的基础上描述并实现了基于语义相关性的关键字查询算法.由于关系型存储具有严密的理论及成熟的实现技术,XML信息的后台存储利用关系数据库来实现.最后将基于语义相关性的关键字查询方法和MLCA方法的查询结果进行比较.实验表明,基于语义相关性的关键字查询方法更好地表达了用户的查询意图,在查询的有效性和查询效率上都有较大改进.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号