【24h】

Efficient bulk-loading of gridfiles

机译:高效批量加载gridfile

获取原文
获取原文并翻译 | 示例

摘要

This paper considers the problem of bulk-loading large data sets for the gridfile multiattribute indexing technique. We propose a rectilinear partitioning algorithm that heuristically seeks to minimize the size of the gridfile needed to ensure no bucket overflows. Empirical studies on both synthetic data sets and on data sets drawn from computational fluid dynamics applications demonstrate that our algorithm is very efficient, and is able to handle large data sets. In addition, we present an algorithm for bulk-loading data sets too large to fit in main memory. Utilizing a sort of the entire data set it creates a gridfile without incurring any overflows.
机译:本文考虑了为网格文件多属性索引技术批量加载大型数据集的问题。我们提出了一种直线分区算法,该算法启发性地寻求最小化确保没有存储桶溢出所需的网格文件的大小。对合成数据集和从计算流体力学应用程序中提取的数据集的经验研究表明,我们的算法非常有效,并且能够处理大型数据集。此外,我们提出了一种算法,用于批量加载太大而无法容纳在主内存中的数据集。利用某种完整的数据集,它创建了一个gridfile,而不会引起任何溢出。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号