首页> 中国专利> 基于分布式系统的交互式大数据查询方法、装置、存储介质和终端设备

基于分布式系统的交互式大数据查询方法、装置、存储介质和终端设备

摘要

本发明提出一种基于分布式系统的交互式大数据查询方法、装置、存储介质及终端设备,所述分布式系统包括执行name node进程的hadoop hdfs调度服务器、执行master进程的spark调度服务器、执行job tracker进程的mapreduce调度服务器以及多个节点服务器,其中,每个节点服务器均部署有执行hdfs datanode进程、spark worker进程和mapreduce node进程。以及原始数据经过mapreduce的处理导入到hadoop hdfs中并进行格式优化,查询任务提交到spark上,会以最大的并发度执行,直接读取导入的数据进行本地化计算,能够极大的提高大数据查询的效率。

著录项

  • 公开/公告号CN108241539B

    专利类型发明专利

  • 公开/公告日2021-05-07

    原文格式PDF

  • 申请/专利权人 百度在线网络技术(北京)有限公司;

    申请/专利号CN201810004955.2

  • 申请日2018-01-03

  • 分类号G06F9/50(20060101);G06F9/48(20060101);

  • 代理机构11313 北京市铸成律师事务所;

  • 代理人张臻贤;李够生

  • 地址 100085 北京市海淀区上地十街10号百度大厦三层

  • 入库时间 2022-08-23 11:45:46

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号