首页> 外文会议>International Conference on Data Mining >Text Cube: Computing IR Measures for Multidimensional Text Database Analysis
【24h】

Text Cube: Computing IR Measures for Multidimensional Text Database Analysis

机译:文本立方体:计算红外文本数据库分析的IR措施

获取原文

摘要

Since Jim Gray introduced the concept of "data cube" in 1997, data cube, associated with online analytical processing (OLAP), has become a driving engine in data warehouse industry. Because the boom of Internet has given rise to an ever increasing amount of text data associated with other multidimensional information, it is natural to propose a data cube model that integrates the power of traditional OLAP and IR techniques for text. In this paper, we propose a Text-Cube model on multidimensional text database and study effective OLAP over such data. Two kinds of hierarchies are distinguishable inside: dimensional hierarchy and term hierarchy. By incorporating these hierarchies, we conduct systematic studies on efficient text-cube implementation, OLAP execution and query processing. Our performance study shows the high promise of our methods.
机译:由于Jim Gray以1997年推出了“数据立方体”的概念,因此数据立方体与在线分析处理(OLAP)相关联,已成为数据仓库行业的驱动引擎。由于互联网的繁荣引起了与其他多维信息相关的越来越多的文本数据,因此提出了一种数据多维数据集模型,该模型集成了传统OLAP和IR技术的文本的权力。在本文中,我们在多维文本数据库上提出了一种关于多维文本数据库的文本 - 立方体模型,并在这些数据上研究有效的OLAP。内部可区分两种层次结构:维度层次结构和术语层次结构。通过结合这些层次结构,我们对有效的文本 - 立方体实现,OLAP执行和查询处理进行系统研究。我们的绩效研究显示了我们的方法的高效。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号