首页> 外文期刊>The VLDB journal >RHEEMix in the data jungle: a cost-based optimizer for cross-platform systems
【24h】

RHEEMix in the data jungle: a cost-based optimizer for cross-platform systems

机译:Rheemix在Data Jungle中:用于跨平台系统的基于成本的优化器

获取原文
获取原文并翻译 | 示例
获取外文期刊封面目录资料

摘要

Data analytics are moving beyond the limits of a single platform. In this paper, we present the cost-based optimizer of Rheem, an open-source cross-platform system that copes with these new requirements. The optimizer allocates the subtasks of data analytic tasks to the most suitable platforms. Our main contributions are: (i) a mechanism based on graph transformations to explore alternative execution strategies; (ii) a novel graph-based approach to determine efficient data movement plans among subtasks and platforms; and (iii) an efficient plan enumeration algorithm, based on a novel enumeration algebra. We extensively evaluate our optimizer under diverse real tasks. We show that our optimizer can perform tasks more than one order of magnitude faster when using multiple platforms than when using a single platform.
机译:数据分析正在超出单个平台的极限。在本文中,我们介绍了Rheem的成本基础优化器,这是一个与这些新要求的开源跨平台系统。优化器将数据分析任务的子任务分配给最合适的平台。我们的主要贡献是:(i)基于图形转换的机制来探索替代执行策略; (ii)基于图形的基于图形的方法,可以确定子任务和平台之间的有效数据移动计划; (iii)基于新型枚举代数的有效计划枚举算法。我们在不同的真实任务下广泛评估了我们的优化器。我们表明,当使用多个平台时,我们的优化器可以在使用多个平台时更快地执行多阶数量的任务。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号