【24h】

Output-Sensitive Autocompletion Search

机译:输出敏感的自动完成搜索

获取原文

摘要

We consider the following autocompletion search scenario: imagine a user of a search engine typing a query; then with every keystroke display those completions of the last query word that would lead to the best hits, and also display the best such hits. The following problem is at the core of this feature: for a fixed document collection, given a set D of documents, and an alphabetical range W of words, compute the set of all word-in-document pairs (ω, d) from the collection such that ω ∈ W and d ∈ D. We present a new data structure with the help of which such autocompletion queries can be processed, on the average, in time linear in the input plus output size, independent of the size of the underlying document collection. At the same time, our data structure uses no more space than an inverted index. Actual query processing times on a large test collection correlate almost perfectly with our theoretical bound.
机译:我们考虑以下自动完成搜索方案:想象一下键入查询的搜索引擎的用户;然后,使用每个击键都显示将导致最佳点击的最后一个查询字的完成,并显示最佳此类命中。以下问题在此功能的核心处:针对一个固定的文档集合,给定文件D的文件,以及字母的单词范围W,从而计算来自的所有单词文档对(ω,d)的集合集合使得ω∈w和d≠d。我们借助该新数据结构可以在输入加上输入加输出大小的平均值,在输入加输出大小的时间内处理新的数据结构,与底层的大小无关文件集合。同时,我们的数据结构不使用比反相索引更多的空间。大型测试收集的实际查询处理时间几乎完美地关联,我们的理论界限几乎完美。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号