首页> 外文期刊>Knowledge and Data Engineering, IEEE Transactions on >Efficient Keyword-Based Search for Top-K Cells in Text Cube
【24h】

Efficient Keyword-Based Search for Top-K Cells in Text Cube

机译:基于关键词的高效搜索文本多维数据集的前K个单元格

获取原文
获取原文并翻译 | 示例

摘要

Previous studies on supporting free-form keyword queries over RDBMSs provide users with linked structures (e.g., a set of joined tuples) that are relevant to a given keyword query. Most of them focus on ranking individual tuples from one table or joins of multiple tables containing a set of keywords. In this paper, we study the problem of keyword search in a data cube with text-rich dimension(s) (so-called text cube). The text cube is built on a multidimensional text database, where each row is associated with some text data (a document) and other structural dimensions (attributes). A cell in the text cube aggregates a set of documents with matching attribute values in a subset of dimensions. We define a keyword-based query language and an IR-style relevance model for scoring/ranking cells in the text cube. Given a keyword query, our goal is to find the top-k most relevant cells. We propose four approaches: inverted-index one-scan, document sorted-scan, bottom-up dynamic programming, and search-space ordering. The search-space ordering algorithm explores only a small portion of the text cube for finding the top-k answers, and enables early termination. Extensive experimental studies are conducted to verify the effectiveness and efficiency of the proposed approaches.
机译:先前关于在RDBMS上支持自由格式关键字查询的研究为用户提供了与给定关键字查询相关的链接结构(例如,一组连接的元组)。它们中的大多数集中于对一个表或包含一组关键字的多个表的联接中的单个元组进行排名。在本文中,我们研究了在具有丰富文本维度的数据立方体(所谓的文本立方体)中的关键字搜索问题。文本多维数据集建立在多维文本数据库上,其中每一行都与某些文本数据(文档)和其他结构维度(属性)相关联。文本多维数据集中的单元格聚合一组文档,这些文档在维度的子集中具有匹配的属性值。我们定义了一个基于关键字的查询语言和一个IR样式的相关性模型,用于对文本多维数据集中的单元格进行评分/排名。给定关键字查询,我们的目标是找到最相关的前k个单元。我们提出了四种方法:倒排索引一次扫描,文档排序扫描,自底向上的动态编程和搜索空间排序。搜索空间排序算法仅探索文本多维数据集中的一小部分,以找到前k个答案,并能够尽早终止。进行了广泛的实验研究,以验证所提出方法的有效性和效率。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号