首页> 中国专利> 一种提高Spark SQL的查询效率的方法

一种提高Spark SQL的查询效率的方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种提高Spark SQL的查询效率的方法。本发明包括步骤S1：构建查询预分析模块，通过估算模型，计算Shuffle产生的中间数据的大小，从而计算出用于缓存所述中间数据的中间数据缓存层的总大小；步骤S2：根据步骤1计算出的中间数据缓存层的总大小，结合集群中每个结点输入数据的分布情况，通过缓存层分配模块为每个结点设置合理的内存空间大小。本发明能有效地通过Shuffle中间数据缓存处理方法解决Spark SQL查询中磁盘I/O开销较高的问题。

著录项

公开/公告号CN108710640A

专利类型发明专利
公开/公告日2018-10-26

原文格式PDF
申请/专利权人东南大学;
展开▼

申请/专利号CN201810351379.9
发明设计人宋爱波;万雨桐;
展开▼

申请日2018-04-17
分类号
代理机构南京众联专利代理有限公司;
代理人许小莉
地址 210096 江苏省南京市玄武区四牌楼2号
入库时间 2023-06-19 06:58:50

法律信息

法律状态公告日

法律状态信息

法律状态
2018-11-20

实质审查的生效 IPC(主分类):G06F17/30 申请日:20180417

实质审查的生效
2018-10-26

公开

公开

相似文献

专利
中文文献
外文文献

1. 一种提高Spark SQL的查询效率的方法 [P] . 中国专利： CN108710640B . 2021.11.12
2. 一种提高趋势数据查询效率的池化结构及方法 [P] . 中国专利： CN114020791A . 2022-02-08
3. SYSTEM, METHOD, AND PROGRAM FOR INCREASING EFFICIENCY OF DATABASE QUERIES [P] . US2021334264A1 . 2021-10-28

机译：用于提高数据库查询效率的系统，方法和程序
4. SYSTEM, METHOD, AND PROGRAM FOR INCREASING EFFICIENCY OF DATABASE QUERIES [P] . 世界知识产权组织专利： WO2020121359A1 . 2020-06-18

机译：用于提高数据库查询效率的系统，方法和程序
5. Method and system for scheduling multi-radio-frequency-identification-tag-reader networks to increase interrogation efficiency [P] . 美国专利： US8093989B2 . 2012-01-10

机译：调度多射频识别标签阅读器网络以提高查询效率的方法和系统