首页> 外文期刊>情報処理 >5分で分かる!? 有名論文ナナメ読み
【24h】

5分で分かる!? 有名論文ナナメ読み

机译:在5分钟内了解!著名论文阅读

获取原文
获取原文并翻译 | 示例
       

摘要

文書から任意の文字の並びを検索することを全文検索と呼ぶ.全文検索を高速に行うためには,あらかじめ文書を検索しやすいように索引化しておけばよい.索引法の1つとして知られる接尾辞配列は,文書中に現れるすべての接尾辞A1を辞書順にソートし,各接尾辞の出現位置を記録したデータ構造である.図-1に文書:"ATGAATGCGA$"の接尾辞配列を示す.接尾辞配列では,接頭辞が共通する接尾辞は隣り合うため,パターン"ATG"の存在を確かめるには接尾辞配列を二分探索すればよいのだが,文書の大きさに依存した検索時間が必要となってしまう.本稿では,接尾辞配列と密接な関係があるBurrows-Wheeler変換(BWT)を用いて文書の大きさに依存しない検索時間を実現した索引法の論文を紹介する.本論文自体の引用件数は1,012 にとどまるがな2,この画期的な索引法は後にFM-indexと名づけられ30,000件を超える研究論文で利用されている.FM-indexは一体何に応用されたのか.
机译:在文档中搜索任意字符序列称为全文搜索,为了高速执行全文搜索,预先对文档进行索引以使其易于搜索就足够了,这被称为索引方法。后缀数组是一种数据结构,其中按字典顺序对文档中出现的所有后缀A1进行排序,并记录每个后缀的出现位置,文档后缀数组“ ATGAATGCGA $ ”如图1所示。在后缀数组中,具有相同前缀的后缀彼此相邻,因此,要检查模式“ ATG ”是否存在,通过二进制搜索来搜索后缀数组就足够了,但这取决于文档的大小。在本文中,我们介绍了一种索引方法,该方法通过使用与后缀数组密切相关的Burrows-Wheeler变换(BWT)实现与文档大小无关的搜索时间。尽管本文本身被引用的次数为1,012,2,但这种革命性的索引方法后来被称为FM-index,已在30,000多个研究论文中使用。应用了吗?

著录项

  • 来源
    《情報処理》 |2019年第6期|554-556|共3页
  • 作者

    清水佳奈;

  • 作者单位

    早稲田大学;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 jpn
  • 中图分类
  • 关键词

  • 入库时间 2022-08-18 04:20:37

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号