首页> 外国专利> OPTIMIZING DATA PARTITIONING FOR DATA-PARALLEL COMPUTING

OPTIMIZING DATA PARTITIONING FOR DATA-PARALLEL COMPUTING

机译:优化数据分区以进行数据并行计算

摘要

A data partitioning plan is automatically generated that—given a data-parallel program and a large input dataset, and without having to first run the program on the input dataset—substantially optimizes performance of the distributed execution system that explicitly measures and infers various properties of both data and computation to perform cost estimation and optimization. Estimation may comprise inferring the cost of a candidate data partitioning plan, and optimization may comprise generating an optimal partitioning plan based on the estimated costs of computation and input/output.
机译:自动生成一个数据分区计划,该计划具有一个数据并行程序和一个大型输入数据集,而无需首先在输入数据集上运行该程序,从而大大优化了分布式执行系统的性能,该系统明确地测量和推断了以下各项的属性数据和计算都可以执行成本估算和优化。估计可以包括推断候选数据划分计划的成本,并且优化可以包括基于估计的计算和输入/输出成本来生成最佳划分计划。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号