【24h】

Phrase Queries with Inverted + Direct Indexes

机译:具有反向+直接索引的词组查询

获取原文

摘要

Phrase queries play an important role in web search and other applications. Traditionally, phrase queries have been processed using a positional inverted index, potentially augmented by selected multiword sequences (e.g., n-grams or frequent noun phrases). In this work, instead of augmenting the inverted index, we take a radically different approach and leverage the direct index, which provides efficient access to compact representations of documents. Modern retrieval systems maintain such a direct index, for instance, to generate snippets or compute proximity features. We present extensions of the established term-at-a-time and document-at-a-time query-processing methods that make effective combined use of the inverted index and the direct index. Our experiments on two real-world document collections using diverse query workloads demonstrate that our methods improve response time substantially without requiring additional index space.
机译:词组查询在网络搜索和其他应用程序中起着重要作用。传统上,短语查询是使用位置倒排索引处理的,可能会通过选定的多词序列(例如n-gram或常用名词短语)进行扩充。在这项工作中,我们没有采用根本不同的方法,而是增加了直接索引的使用,从而提供了对文档的紧凑表示形式的有效访问,而不是增加反向索引。现代检索系统维护这种直接索引,例如,以生成摘要或计算邻近特征。我们将介绍已建立的术语“一次”和“文档一次”查询处理方法的扩展,这些方法可以有效地结合使用倒排索引和直接索引。我们对使用不同查询工作负载的两个实际文档集合进行的实验表明,我们的方法大大缩短了响应时间,而无需额外的索引空间。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号