首页> 外文期刊>電子情報通信学会技術研究報告 >簡潔データ構造による全文検索のハードウェアを用いた高速化
【24h】

簡潔データ構造による全文検索のハードウェアを用いた高速化

机译:使用具有简洁数据结构的硬件加速全文搜索

获取原文
获取原文并翻译 | 示例
       

摘要

接尾辞配列は高速な全文検索に適したアルゴリズムである.巨大なデータを処理するために,データ構造を情報理論的下限まで圧縮した簡潔データ構造の利用が注目されている.一方で,圧縮されたデータの解凍をする処理が必要であり,そのオーバヘッドが問題となっている.圧縮接尾辞配列は接尾辞配列に簡潔データ構造を応用したアルゴリズムである.データ構造の性質上,主要な操作においてビットベクトルに対する演算,メモリに対するランダムアクセスが大量に必要となる.我々は圧縮接尾辞配列による全文検索を高速化するためのFPGAを用いたハードウェアアクセラレータを提案する.ハードウェアの並列性を利用することにより,ビットベクトルに対する演算の高速化やオーバヘッドの無いメモリアクセス順の制御が可能である.ハードウェアアクセラレータによる全文検索,テキスト復元のシミュレーションを行い,ソフトウェア実装の性能と比較することにより評価を行ったところ,それぞれ7倍,3倍以上の性能向上が得られるという結果が得られた.%Full-text searches for massive data are important in Web search and genomic analysis. Suffix array is a fast full-text search algorithm. Succinct data structure is a data structure compressed to the information-theoretic bound and improves the amount of data processible on memory. Compressed suffix array is an algorithm applying the succinct data structure to suffix array. We propose a FPGA-based hardware accelerator for full-text search using compressed suffix array. We evaluated by simulations its performances of full-text search and decompression of compressed suffix array. We compared its performance with that of a software implementation.
机译:后缀数组是一种适用于高速全文本搜索的算法,为了处理大量数据,要注意使用紧凑的数据结构,该结构将数据结构压缩到信息理论的下限。但是,压缩后缀数组是一种将简洁的数据结构应用于后缀数组的算法,由于该数据结构的性质,主要操作是需要大量的位向量运算和对存储器的随机访问,我们提出了一种使用FPGA的硬件加速器,以通过压缩后缀数组来加速全文本搜索。这样,可以加速对位向量的操作并控制内存访问顺序,而不会产生开销通过硬件加速器进行全文搜索,模拟文本还原以及通过与软件实现的性能比较进行评估我们发现结果分别是7倍,3倍或更多。%大量数据的全文搜索在Web搜索和基因组分析中很重要,后缀数组是一种快速的全文搜索算法。简洁的数据结构是一种压缩到信息理论界限的数据结构,它提高了可在存储器上处理的数据量压缩的后缀数组是一种将简洁的数据结构应用于后缀数组的算法。我们提出了一种基于FPGA的硬件加速器压缩后缀数组进行文本搜索。我们通过仿真评估了其全文搜索和解压缩性能。压缩后缀数组。我们将其性能与软件实现的性能进行了比较。

著录项

  • 来源
    《電子情報通信学会技術研究報告》 |2008年第180期|p.7-12|共6页
  • 作者单位

    東京大学大学院情報理工学系研究科コンピュータ科学専攻 〒113-8656 東京都文京区本郷7-3-1;

    グーグル株式会社 〒150-8512 東京都渋谷区桜丘町26-1セルリアンタワー6F;

    東京大学大学院情報理工学系研究科コンピュータ科学専攻 〒113-8656 東京都文京区本郷7-3-1;

    九州大学大学院システム情報科学研究院 〒819-0395 福岡市西区元岡744;

    東京大学大学院情報理工学系研究科創造情報学専攻 〒101-0021 東京都千代田区外神田1-18-13 秋葉原ダイビル(13階);

    東京大学大学院情報理工学系研究科創造情報学専攻 〒101-0021 東京都千代田区外神田1-18-13 秋葉原ダイビル(13階);

  • 收录信息
  • 原文格式 PDF
  • 正文语种 jpn
  • 中图分类
  • 关键词

    簡潔データ構造; 圧縮接尾辞配列; 全文検索; FPGA; ハードウェアアクセラレータ;

    机译:紧凑的数据结构;压缩后缀数组;全文搜索;FPGA;硬件加速器;
  • 入库时间 2022-08-18 00:37:34

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号