首页> 外文会议>International Symposium on Algorithms and Computation >Top-k Document Retrieval in Compact Space and Near-Optimal Time
【24h】

Top-k Document Retrieval in Compact Space and Near-Optimal Time

机译:Top-K文件在紧凑空间和近乎最佳时间内检索

获取原文

摘要

Let D={d_1, d_2, ...d_D} be a given set of D string documents of total length n. Our task is to index D such that the k most relevant documents for an online query pattern P of length p can be retrieved efficiently. There exist linear space data structures of O(n) words for answering such queries in optimal O(p+k) time. In this paper, we describe a compact index of size |CSA|+n lgD+o(n lgD) bits with near optimal time, O(p+k lg? n), for the basic relevance metric term-frequency, where |CSA| is the size (in bits) of a compressed full-text index of D, and lg? n is the iterated logarithm of n.
机译:设d = {d_1,d_2,... d_d}是总长度n的给定的d字符串文档集。我们的任务是索引D,使得可以有效地检索长度P的在线查询模式P的K最相关文件。在最佳O(P + k)时间中回答此类查询的O(n)单词的线性空间数据结构。在本文中,我们描述了具有近最佳时间的CSA | + N LGD + O(N LGD)位的紧凑型索引,对于基本相关度量术语 - 频率,其中o(p + klg≤n),其中CSA |是D和LG压缩全文索引的大小(以位)? n是n的迭代对数。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号