首页> 外文会议>European Conference on Research and Advanced Technology for Digital Libraries >Space-Efficient Support for Temporal Text Indexing in a Document Archive Context
【24h】

Space-Efficient Support for Temporal Text Indexing in a Document Archive Context

机译:在文档存档上下文中的时间文本索引的空间有效支持

获取原文

摘要

Support for temporal text-containment queries (query for all versions of documents that contained one or more particular words at a particular time t) is of interest in a number of contexts, including web archives, in a smaller scale temporal XML/web warehouses, and temporal document database systems in general. In the V2 temporal document database system we employed a combination of full-text indexes and variants of time indexes to perform efficient text-containment queries. That approach was optimized for moderately large temporal document databases. However, for "extremely large databases" the index space usage of the approach could be too large. In this paper, we present a more space-efficient solution to the problem: the interval-based temporal text index (ITTX). We also present appropriate algorithms for update and retrieval, and we discuss advantages and disadvantages of the V2 and ITTX approaches.
机译:支持时间文本密封查询(查询包含在特定时间t的一个或多个特定单词的所有文档的查询)对多个上下文(包括Web Archives)中的一个或多个特定单词,包括较小的刻度时间XML / Web仓库,和临时文档数据库系统一般。在V2时间文档数据库系统中,我们使用全文索引和时间索引变体的组合来执行有效的文本密封查询。该方法针对中等大型时间文档数据库进行了优化。但是,对于“极大的数据库”的索引空间使用可能太大。在本文中,我们对问题提供了更节省的节省空间解决方案:基于间隔的时间文本索引(ITTX)。我们还提供了适当的更新和检索算法,我们讨论了V2和ITTX方法的优缺点。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号