首页> 外文OA文献 >Fast and Scalable Minimal Perfect Hashing for Massive Key Sets
【2h】

Fast and Scalable Minimal Perfect Hashing for Massive Key Sets

机译:适用于大规模密钥集的快速可扩展最小完美哈希

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Minimal perfect hash functions provide space-efficient and collision-free hashing on static sets. Existing algorithms and implementations that build such functions have practical limitations on the number of input elements they can process, due to high construction time, RAM or external memory usage. We revisit a simple algorithm and show that it is highly competitive with the state of the art, especially in terms of construction time and memory usage. We provide a parallel C++ implementation called BBhash. It is capable of creating a minimal perfect hash function of 10^{10} elements in less than 7 minutes using 8 threads and 5 GB of memory, and the resulting function uses 3.7 bits/element. To the best of our knowledge, this is also the first implementation that has been successfully tested on an input of cardinality 10^{12}.Source code: https://github.com/rizkg/BBHash
机译:最小的完美哈希函数可在静态集合上提供节省空间且无冲突的哈希。由于构建时间长,RAM或外部存储器使用量高,构建此类功能的现有算法和实现方式对其可处理的输入元素数量有实际限制。我们重新审视了一种简单的算法,并显示了它与最新技术的竞争优势,尤其是在构造时间和内存使用方面。我们提供了一个称为BBhash的并行C ++实现。它能够在不到7分钟的时间内使用8个线程和5 GB内存创建一个最小的10 ^ {10}元素的完美散列函数,并且生成的函数使用3.7位/元素。据我们所知,这也是第一个已经在基数为10 ^ {12}的输入上成功测试的实现。源代码:https://github.com/rizkg/BBHash

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号