首页> 中国专利> 大规模工业数据压缩存储方法、系统及介质

大规模工业数据压缩存储方法、系统及介质

摘要

本发明提供了一种大规模工业数据压缩存储方法、系统及介质,包括:步骤1:根据数据源类型配置不同的数据采集系统,通过界面化操作对数据采集系统采集的数据进行提取;步骤2:定义转化链,通过数据清洗插件将提取的不同类型的数据的格式临时转化成Avro格式;步骤3:以GPL协议压缩Avro格式的数据,压缩格式为snappy,并在分布式文件系统中创建以parquet为存储格式的数据集,对压缩后的数据进行存储。本发明能够对任何类型数据定义转化链和压缩和存储格式,大大提高计算平台数据处理速度和数据压缩比率。

著录项

  • 公开/公告号CN112214453B

    专利类型发明专利

  • 公开/公告日2021-10-01

    原文格式PDF

  • 申请/专利号CN202010961819.X

  • 发明设计人 高响;

    申请日2020-09-14

  • 分类号G06F16/11(20190101);G06F16/16(20190101);G06F16/174(20190101);G06F16/182(20190101);

  • 代理机构31334 上海段和段律师事务所;

  • 代理人李佳俊;郭国中

  • 地址 201100 上海市闵行区元江路5500号第1幢

  • 入库时间 2022-08-23 12:33:57

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号