首页> 中国专利> 一种基于列存储的区级数据压缩方法

一种基于列存储的区级数据压缩方法

摘要

本发明涉及一种基于列存储的数据压缩方法,其特征在于包括以下步骤:步骤1、将按列存储的数据进一步划分为多个区;步骤2、为区中的数据定义一组统计信息;步骤3、利用步骤2中的统计信息,为每一个区按顺序定义一组统计量,进行该区数据分布特点的量化估计;步骤4、利用学习得到的区的统计量计算相邻两区之间的相似因子;步骤5、对于一列中的第一个区,依次计算各个统计量的值,采用逐步选择的方法,根据统计值进行压缩方法选择;步骤6、对于剩余第i个区,利用该区的统计值计算相邻两区之间的相似因子;若相似性较高,则直接沿用上一区的压缩策略,否则按照步骤5中压缩方法选择方式,重新选择压缩方法;步骤7、对当前区按获得的压缩方法进行压缩。本发明提供了一种基于列存储的压缩方法,按区进行压缩,并设计了高效的压缩策略选择方法,能够有效的支持面向列存储的海量数据管理。

著录项

  • 公开/公告号CN102609491A

    专利类型发明专利

  • 公开/公告日2012-07-25

    原文格式PDF

  • 申请/专利权人 东华大学;

    申请/专利号CN201210019945.9

  • 发明设计人 乐嘉锦;王梅;夏小玲;

    申请日2012-01-20

  • 分类号G06F17/30(20060101);

  • 代理机构31001 上海申汇专利代理有限公司;

  • 代理人翁若莹;柏子雵

  • 地址 201620 上海市松江区人民北路2999号

  • 入库时间 2023-12-18 06:17:12

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2014-10-15

    发明专利申请公布后的视为撤回 IPC(主分类):G06F17/30 申请公布日:20120725 申请日:20120120

    发明专利申请公布后的视为撤回

  • 2012-09-26

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20120120

    实质审查的生效

  • 2012-07-25

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号