基于Spark的RDF数据toP-k查询计算研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

近年来，语义Web发展迅猛，RDF数据也得了广泛的支持与研究。随着RDF数据的规模越来越大，传统的集中式环境下针对RDF数据的查询研究越来越无法适应数据查询领域的需求，特别是针对RDF数据的top-k查询。随着分布式领域的逐步发展，具有海量存储能力以及并行计算能力的分布式系统逐渐成为解决这类问题的研究热点。而Spark分布式系统恰恰是其中的佼佼者。
　　本文基于Spark分布式计算系统以及HBase分布式存储系统，对应用于大规模RDF数据存储以及top-k查询算法进行了设计与研究。本文分析了传统RDF数据存储模式的优缺点，设计并实现了适用于top-k查询的基于HBase存储特点的RDF存储索引结构。基于这种存储模式并借鉴于传统top-k查询处理技术的特点，提出了一种分布式系统下的top-k查询方案STA查询算法，致力于减少算法运行过程中RDF数据的连接操作。在此基础上并根据Spark分布式系统数据的处理特点，本文改进STA算法提出了一种新的查询方案SSJA查询算法，致力于减少对中间数据的排序相关的操作。此外，本文还搭建了HBase分布式存储环境以及Spark分布式计算环境，实现了上述两种实验方案并进行了测试。实验结果证明，SSJA算法在性能以及适用性上都优于STA算法。

著录项

作者
肖峥荣;
展开▼
作者单位

武汉科技大学;

展开▼
授予单位武汉科技大学;
学科软件工程
授予学位硕士
导师姓名顾进广;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类存贮器;
关键词
RDF数据; top-k查询; 分布式系统; 存储模式; 适用性;

相似文献

中文文献
外文文献
专利

1. 基于SPARK的大规模RDF数据上的SPARQL查询算法 [J] . 崔家奇 ,闫威 . 计算机应用与软件 . 2020,第012期
2. 基于Spark和Redis的大规模RDF数据查询系统 [J] . 阳杰 ,王木涵 ,徐九韵 . 计算机系统应用 . 2017,第009期
3. RDF 图的 Top-k 最短路径查询 [J] . 章登义 ,吴文李 ,欧阳黜霏 . 电子学报 . 2015,第008期
4. 基于多粒度Top-k查询的流式数据事件获取方法 [J] . 王俊陆 ,梅昕苏 ,丁琳琳 . 辽宁大学学报（自然科学版） . 2019,第003期
5. 基于聚集约束的不确定性数据Top-k查询 [J] . 占仟豪 ,刘斌 . 电脑知识与技术 . 2016,第020期
6. 一种基于不确定数据的Top-k查询算法 [C] . 杨志邦 . 浙江省信号处理学会2015学术年会 . 2015
7. RDF知识图谱语义近似Top-k查询研究及应用 [A] . 葛张鹏 . 2019

基于Spark的RDF数据toP-k查询计算研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅