首页> 外文OA文献 >Efficient Versioning for Scientific Array Databases
【2h】

Efficient Versioning for Scientific Array Databases

机译:科学数组数据库的高效版本控制

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

In this paper, we describe a versioned database storage manager we are developing for the SciDB scientific database. The system is designed to efficiently store and retrieve array-oriented data, exposing a "no-overwrite" storage model in which each update creates a new "version" of an array. This makes it possible to perform comparisons of versions produced at different times or by different algorithms, and to create complex chains and trees of versions. We present algorithms to efficiently encode these versions, minimizing storage space while still providing efficient access to the data. Additionally, we present an optimal algorithm that, given a long sequence of versions, determines which versions to encode in terms of each other (using delta compression) to minimize total storage space or query execution cost. We compare the performance of these algorithms on real world data sets from the National Oceanic and Atmospheric Administration (NOAA), Open Street Maps, and several other sources. We show that our algorithms provide better performance than existing version control systems not optimized for array data, both in terms of storage size and access time, and that our delta-compression algorithms are able to substantially reduce the total storage space when versions exist with a high degree of similarity.
机译:在本文中,我们描述了我们为SciDB科学数据库开发的版本化数据库存储管理器。该系统旨在有效地存储和检索面向阵列的数据,从而暴露出“无覆盖”存储模型,其中每次更新都会创建阵列的新“版本”。这使得可以对在不同时间或通过不同算法生成的版本进行比较,并创建复杂的版本链和树。我们提出了有效编码这些版本的算法,从而最大程度地减少了存储空间,同时仍然提供了对数据的有效访问。此外,我们提供了一种最佳算法,该算法在给定较长的版本序列的情况下,确定要相互编码的版本(使用增量压缩),以最大程度地减少总存储空间或查询执行成本。我们比较了这些算法在来自国家海洋与大气管理局(NOAA),开放街道地图和其他几种来源的真实世界数据集上的性能。我们证明,与现有的版本控制系统(未针对阵列数据进行优化)相比,我们的算法在存储大小和访问时间方面都具有更好的性能,并且当存在带有以下内容的版本时,我们的增量压缩算法能够大幅减少总存储空间:高度相似。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号