首页> 外国专利> Multiple query optimization in SQL-on-Hadoop systems

Multiple query optimization in SQL-on-Hadoop systems

机译:Hadoop上的SQL系统中的多查询优化

摘要

To reduce the overall computation time of a batch of queries, multiple query optimization in SQL-on-Hadoop systems groups multiple MapReduce jobs converted from queries into a single one, thus avoiding redundant computations by taking sharing opportunities of data scan, map function and map output. SQL-on-Hadoop converts a query into a DAG of MapReduce jobs and each map function is a part of query plan composed of a sequence of relational operators. As each map function is a part of query plan which is usually complex and heavy, disclosed method creates a cost model to simulate the computation time which takes both I/O cost for reading/writing input file and intermediate data and CPU cost for the computation of map function into consideration. A heuristic algorithm is disclosed to find near-optimal integrated query plan for each group based on an observation that each query plan is locally optimal.
机译:为了减少一批查询的总体计算时间,Hadoop上的SQL系统中的多个查询优化将多个从查询转换成的MapReduce作业分组为一个作业,从而通过共享数据扫描,映射功能和映射的机会来避免冗余计算输出。 Hadoop上的SQL将查询转换为MapReduce作业的DAG,每个地图函数都是由一系列关系运算符组成的查询计划的一部分。由于每个地图功能都是查询计划的一部分,通常是复杂而繁重的,因此,所公开的方法创建了一个成本模型来模拟计算时间,该成本花费了读写输入文件和中间数据的I / O成本以及用于计算的CPU成本地图功能的考虑。公开了一种启发式算法,以基于每个查询计划是局部最优的观察来为每个组找到接近最优的综合查询计划。

著录项

  • 公开/公告号US10572478B2

    专利类型

  • 公开/公告日2020-02-25

    原文格式PDF

  • 申请/专利权人 NEC CORPORATION;

    申请/专利号US201415523729

  • 发明设计人 TING CHEN;KAZUYO NARITA;

    申请日2014-12-01

  • 分类号G06F7/02;G06F16;G06F16/2453;G06F16/2458;

  • 国家 US

  • 入库时间 2022-08-21 11:28:30

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号