一种数据空间中非结构化数据查询方法

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着计算机技术的快速发展，数据信息呈现出许多新的特征，包括数据的海量性，数据形式的异构性以及数据间关联的复杂性。传统的数据库管理技术在应对挑战时已显得力不从心，数据空间的理念应运而生，由于具备逐步演化的构建方式以及对数据模式的弱依赖等性质，因此能够满足日益复杂的管理需求和服务需求。
　　越来越多的应用需要对结构化数据和非结构化数据同时进行访问，与此同时，在数据空间中也需要提供某种服务实现对数据空间中所有结构化和非结构化数据的无缝查询。在信息检索和数据库领域，各类型数据的查询都是其主要的研究方向，近年来，数据库研究团体对结构化数据集（如关系数据库、XML数据库）的关键字查询进行了大量研究并取得一定成果。而针对另一个方向，基于非结构化数据的结构化查询方法研究则少有进展。
　　本文研究数据空间中非结构化数据的查询转换技术，提出了一种对非结构化数据的结构化查询方法，该方法从结构化查询语句中抽取关键字集，并将得到的关键字集应用于非结构化数据的查询。首先，根据查询图的定义及构建方法，将结构化查询语句转换成对应的查询图，查询图包含查询语句基本信息的同时也去除了一些不相关语法特征。其次，为了从查询图的标签中抽取关键字，本文基于信息熵和代表度确定一个标签是否为关键字，又提出了i-scores更新算法和基于贪心策略的Label-Selection抽取算法，用于完成对关键字的抽取。最后，运用领域知识对现有方法进行改进，并验证了查询语句中表和属性值个数对查询结果的影响。实验结果表明：本文所提出的方法在不同领域的大量数据集中均取得较好的结果，本文提出的基于查询图的关键字抽取方法较其它朴素方法查询精度更高。

著录项

作者
李先蒙;
展开▼
作者单位

哈尔滨工程大学;

展开▼
授予单位哈尔滨工程大学;
学科计算机应用技术
授予学位硕士
导师姓名王念滨;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.13;
关键词
数据空间; 非结构化数据; 无缝查询; 关键字抽取; 语句转换;
入库时间 2022-08-17 10:35:26

相似文献

中文文献
外文文献
专利

1. 基于HBase的高效结构化数据查询方法研究 [J] . 沙学府 ,陆保国 ,何锡点 . 数字技术与应用 . 2015,第005期
2. 基于HBase的高效结构化数据查询方法研究 [J] . 沙学府 ,陆保国 ,何锡点 . 数字技术与应用 . 2015,第005期
3. 半结构化数据的表示及查询方法研究 [J] . 陈恩红 ,石竹 ,王煦法 . 计算机工程 . 2001,第005期
4. 一种结构化数据和半结构化数据的统一集成模型 [J] . 李生琦 ,徐福缘 ,徐莹 . 计算机工程与应用 . 2004,第015期
5. 数字研发系统中非结构化数据的融合方法研究 [J] . 陈严纾 ,林彧茜 ,蔡宇翔 . 电子世界 . 2021,第017期
6. WWW上半结构化数据的表示及查询方法研究 [C] . 陈恩红 ,范焱 ,蔡庆生 . 第五届全国计算机应用联合学术会议 . 1999
7. 数据空间中基于关键字的结构化数据查询方法 [A] . 李铁柱 . 2014

一种数据空间中非结构化数据查询方法

目录

摘要

著录项

相似文献

相关主题

期刊订阅