首页> 中文学位 >一种数据空间中非结构化数据查询方法
【6h】

一种数据空间中非结构化数据查询方法

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章 绪论

1.1 课题研究背景及意义

1.2 国内外研究现状

1.3 主要研究内容

1.4 本文的组织结构

第2章 数据空间及数据查询方法相关研究

2.1 数据空间

2.2 数据空间中的数据模型及查询接口

2.3 相关非结构化数据的结构化查询方法

2.4 本章小结

第3章 一种非结构化数据的查询转换方法

3.1 研究概述

3.2 问题的提出

3.3 查询转换问题定义及方法框架

3.4 查询图

3.5 构建关键字查询

3.6 本章小结

第4章 实验及结果分析

4.1 实验环境

4.2 实验设置

4.3 实验结果及分析

4.4 本章小节

结论

参考文献

致谢

展开▼

摘要

随着计算机技术的快速发展,数据信息呈现出许多新的特征,包括数据的海量性,数据形式的异构性以及数据间关联的复杂性。传统的数据库管理技术在应对挑战时已显得力不从心,数据空间的理念应运而生,由于具备逐步演化的构建方式以及对数据模式的弱依赖等性质,因此能够满足日益复杂的管理需求和服务需求。
  越来越多的应用需要对结构化数据和非结构化数据同时进行访问,与此同时,在数据空间中也需要提供某种服务实现对数据空间中所有结构化和非结构化数据的无缝查询。在信息检索和数据库领域,各类型数据的查询都是其主要的研究方向,近年来,数据库研究团体对结构化数据集(如关系数据库、XML数据库)的关键字查询进行了大量研究并取得一定成果。而针对另一个方向,基于非结构化数据的结构化查询方法研究则少有进展。
  本文研究数据空间中非结构化数据的查询转换技术,提出了一种对非结构化数据的结构化查询方法,该方法从结构化查询语句中抽取关键字集,并将得到的关键字集应用于非结构化数据的查询。首先,根据查询图的定义及构建方法,将结构化查询语句转换成对应的查询图,查询图包含查询语句基本信息的同时也去除了一些不相关语法特征。其次,为了从查询图的标签中抽取关键字,本文基于信息熵和代表度确定一个标签是否为关键字,又提出了i-scores更新算法和基于贪心策略的Label-Selection抽取算法,用于完成对关键字的抽取。最后,运用领域知识对现有方法进行改进,并验证了查询语句中表和属性值个数对查询结果的影响。实验结果表明:本文所提出的方法在不同领域的大量数据集中均取得较好的结果,本文提出的基于查询图的关键字抽取方法较其它朴素方法查询精度更高。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号