Efficient querying of multidimensional RDF data with aggregates: Comparing NoSQL, RDF and relational data stores

Ravat Franck; Song Jiefu; Teste Olivier; Trojahn Cassia

首页> 外文期刊>International Journal of Information Management >Efficient querying of multidimensional RDF data with aggregates: Comparing NoSQL, RDF and relational data stores

【24h】

Efficient querying of multidimensional RDF data with aggregates: Comparing NoSQL, RDF and relational data stores

机译：高效查询聚集体的多维RDF数据：比较NoSQL，RDF和关系数据存储

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

This paper proposes an approach to tackle the problem of querying large volume of statistical RDF data. Our approach relies on pre-aggregation strategies to better manage the analysis of this kind of data. Specifically, we define a conceptual model to represent original RDF data with aggregates in a multidimensional structure. A set of translations rules for converting a well-known multidimensional RDF modelling vocabulary into the proposed conceptual model is then proposed. We implement the conceptual model in six different data stores: two RDF triple stores (Jena TDB and Virtuoso), one graph-oriented NoSQL database (Neo4j), one column-oriented data store (Cassandra), and two relational databases (MySQL and PostGreSQL). We compare the querying performance, with and without aggregates, in these data stores. Experimental results, on real-world datasets containing 81.92 million triplets, show that pre-aggregation allows for reducing query runtime in all data stores. Neo4j NoSQL and relational databases with aggregates outperform triple stores speeding up to 99% query runtime.

机译：本文提出了一种解决调查大量统计RDF数据问题的方法。我们的方法依赖于汇总策略来更好地管理对这种数据的分析。具体地，我们定义了一个概念模型，以表示具有多维结构中的聚合的原始RDF数据。然后提出了一组用于将众所周知的多维RDF建模词汇转换为所提出的概念模型的翻译规则。我们在六个不同的数据存储中实现概念模型：两个RDF三重商店（Jena TDB和Virtuoso），一个面向图形的NoSQL数据库（NEO4J），一个面向列的数据存储（Cassandra）和两个关系数据库（MySQL和PostgreSQL ）。我们在这些数据存储中比较查询性能，在没有聚合的情况下进行查询性能。实验结果，在包含81.92万三胞胎的实际数据集上，表明预聚合允许在所有数据存储中缩短查询运行时。 Neo4j NoSQL和具有聚合的关系数据库优先表达三倍的存储超速高达99％的查询运行时。

著录项

来源
《International Journal of Information Management》 |2020年第10期|102089.1-102089.16|共16页
作者
Ravat Franck; Song Jiefu; Teste Olivier; Trojahn Cassia;
展开▼
作者单位

Univ Toulouse I Capitole IRIT CNRS UMR5505 Toulouse France;

Univ Toulouse I Capitole IRIT CNRS UMR5505 Toulouse France|Activus Grp Toulouse France;

Univ Toulouse II Jean Jaures IRIT CNRS UMR5505 Toulouse France;

Univ Toulouse II Jean Jaures IRIT CNRS UMR5505 Toulouse France;

展开▼
收录信息
原文格式 PDF
正文语种 eng
中图分类
关键词
Statistical RDF data; Graph aggregation; NoSQL; Data analytics;

机译：统计RDF数据;图形聚合;NoSQL;数据分析;

相似文献

外文文献
中文文献
专利

1. Design and evaluation of a NoSQL database for storing and querying RDF data [J] . Kanda Runapongsa Saikaew, Chanuwas Asawamenakul, Marut Buranarach Engineering and Applied Science Research . 2015,第4期

机译：用于存储和查询RDF数据的NoSQL数据库的设计和评估
2. Design and evaluation of a NoSQL database for storing and querying RDF data [J] . Kanda Runapongsa Saikaew, Chanuwas Asawamenakul, Marut Buranarach Engineering and Applied Science Research . 2014,第4期

机译：用于存储和查询RDF数据的NoSQL数据库的设计与评估
3. RDF packages: a scheme for efficient reasoning and querying over large-scale RDF data [J] . Shohei Ohsawa, Toshiyuki Amagasa, Hiroyuki Kitagawa International journal of web information systems . 2012,第2期

机译：RDF软件包：一种用于对大型RDF数据进行有效推理和查询的方案
4. Towards Load Balancing and Parallelizing of RDF Query Processing in P2P Based Distributed RDF Data Stores [C] . Ali Liaquat, Janson Thomas, Schindelhauer Christian Euromicro International Conference on Parallel, Distributed, and Network-Based Processing . 2014

机译：在基于P2P的分布式RDF数据存储中实现RDF查询处理的负载平衡和并行化
5. Efficient, Effective, and Scalable Personalized Keyword Query Interpretation for RDF Databases [D] . Fu, Haizhou 2014

机译：RDF数据库的高效，有效和可扩展的个性化关键字查询解释
6. NCBI2RDF: Enabling Full RDF-Based Access to NCBI Databases [O] . Alberto Anguita, Miguel García-Remesal, Diana de la Iglesia, 2006

机译：NCBI2RDF：启用对NCBI数据库的基于RDF的完全访问
7. Towards Load Balancing and Parallelizing of RDF Query Processing in P2P Based Distributed RDF Data Stores [O] . Liaquat Ali, Thomas Janson, Christian Schindelhauer 2015

机译：基于p2p的分布式RDF数据存储中RDF查询处理的负载均衡与并行化

Efficient querying of multidimensional RDF data with aggregates: Comparing NoSQL, RDF and relational data stores

摘要

著录项

相似文献

相关主题

期刊订阅