【24h】

Output-Sensitive Autocompletion Search

机译:输出敏感的自动补全搜索

获取原文
获取原文并翻译 | 示例

摘要

We consider the following autocompletion search scenario: imagine a user of a search engine typing a query; then with every keystroke display those completions of the last query word that would lead to the best hits, and also display the best such hits. The following problem is at the core of this feature: for a fixed document collection, given a set D of documents, and an alphabetical range W of words, compute the set of all word-in-document pairs (ω, d) from the collection such that ω ∈ W and d ∈ D. We present a new data structure with the help of which such autocompletion queries can be processed, on the average, in time linear in the input plus output size, independent of the size of the underlying document collection. At the same time, our data structure uses no more space than an inverted index. Actual query processing times on a large test collection correlate almost perfectly with our theoretical bound.
机译:我们考虑以下自动完成搜索方案:假设搜索引擎的用户键入查询;然后在每次击键时都显示最后查询词的补全,这将导致最佳匹配,并显示最佳匹配。此功能的核心是以下问题:对于固定的文档集合,给定一组文档D,以及单词的字母范围W,请根据以下公式计算所有文档中单词对(ω,d)的集合:集合,使得ω∈W和d∈D。我们提出了一个新的数据结构,借助该数据结构,平均自动可以在输入加输出大小上线性地处理这种自动补全查询,而与底层的大小无关文件收集。同时,我们的数据结构使用的空间不超过倒排索引的空间。大型测试集合上的实际查询处理时间几乎与我们的理论界限完全相关。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号