An adaptive query execution system for data integration

机译：用于数据集成的自适应查询执行系统

获取原文

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

Query processing in data integration occurs over network-bound, autonomous data sources. This requires extensions to traditional optimization and execution techniques for three reasons: there is an absence of quality statistics about the data, data transfer rates are unpredictable and bursty, and slow or unavailable data sources can often be replaced by overlapping or mirrored sources. This paper presents the Tukwila data integration system, designed to support adaptivity at its core using a two-pronged approach. Interleaved planning and execution with partial optimization allows Tukwila to quickly recover from decisions based on inaccurate estimates. During execution, Tukwila uses adaptive query operators such as the double pipelined hash join, which produces answers quickly, and the dynamic collector, which robustly and efficiently computes unions across overlapping data sources. We demonstrate that the Tukwila architecture extends previous innovations in adaptive execution (such as query scrambling, mid-execution re-optimization, and choose nodes), and we present experimental evidence that our techniques result in behavior desirable for a data integration system.

机译：

数据集成中的查询处理发生在网络绑定的自治数据源上。出于以下三个原因，这需要扩展传统的优化和执行技术：缺少有关数据的质量统计信息，数据传输速率不可预测且突发，并且缓慢或不可用的数据源通常可以由重叠或镜像源替代。本文介绍了Tukwila数据集成系统，该系统旨在使用两管齐下的方法来支持其核心的适应性。具有部分优化功能的交错计划和执行使Tukwila可以根据不准确的估算快速从决策中恢复。在执行期间，Tukwila使用自适应查询运算符，例如快速生成答案的双流水线哈希联接和动态收集器，后者动态有效地计算重叠数据源之间的并集。我们证明了Tukwila架构扩展了自适应执行方面的先前创新（例如查询加扰，中间执行重新优化和选择节点），并且我们提供了实验证据，证明我们的技术可导致数据集成系统所需的行为。 P> 展开▼

著录项

来源
《ACM SIGMOD international conference on Management of data》|1999年|P.299-310|共12页
会议地点
作者
Zachary G. Ives; Daniela Florescu; Marc Friedman; Alon Levy; Daniel S. Weld; PDaniela Florescu; PDaniel S. Weld;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类各种专用数据库;
关键词

相似文献

外文文献
中文文献
专利

1. A Query Simulation System To Illustrate Database Query Execution [J] . Brett Allenstein, Andrew Yost, Paul Wagner, SIGCSE bulletin . 2008,第1期

机译：说明数据库查询执行的查询仿真系统
2. Service-oriented execution model supporting data sharing and adaptive query processing [J] . Wu Y., Liu J., Chen G., Cluster computing . 2010,第2期

机译：面向服务的执行模型，支持数据共享和自适应查询处理
3. Time-Stamp Management and Query Execution in Data Stream Management Systems [J] . Yijian Bai, Thakkar H., Haixun Wang, IEEE internet computing . 2008,第6期

机译：数据流管理系统中的时间戳管理和查询执行
4. An Adaptive Query Execution System for Data Integration [C] . Zachary G. Ives, Daniela Florescu, Marc Friedman, ACM SIGMOD International Conference on Management of Data . 1999

机译：用于数据集成的自适应查询执行系统
5. Adaptive Spatiotemporal Data Integration Using Distributed Query Relaxation over Heterogeneous Observational Datasets [D] . Mitra, Saptashwa. 2018

机译：使用分布式查询放松在异构观测数据集上的自适应时空数据集成
6. Integrating a Federated Healthcare Data Query Platform With Electronic IRB Information Systems [O] . Shan He, John F. Hurdle, Jeffrey R. Botkin, 2010

机译：将联合医疗数据查询平台与IRB电子信息系统集成
7. An adaptive query execution system for data integration [O] . Zachary G. Ives, Daniela Florescu, Marc Friedman, 2015

机译：用于数据集成的自适应查询执行系统

An adaptive query execution system for data integration

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅