首页> 外国专利> Method and system for configuring presence bitmaps identifying records with unique keys in a large data set

Method and system for configuring presence bitmaps identifying records with unique keys in a large data set

机译:用于配置存在位图的方法和系统,该存在位图使用大型数据集中的唯一键来标识记录

摘要

A system, method, and apparatus are provided for supporting and/or executing count-distinct queries. A large set of data (e.g., tens or hundreds of millions of event records) is condensed daily to generate presence bitmaps to reflect the distinctiveness of a selected data dimension S (e.g., user ID) for one or more key dimensions g1, g2, . . . (e.g., advertisement ID, campaign ID, advertiser ID). The condensation process eliminates duplication and yields a single value (e.g., 1 or 0) for each tuple [S, g1, . . . ] to represent the distinctiveness of each value in the S dimension to each combination of values in the grouping dimensions. On a monthly basis, the daily values are condensed to yield a single value for the month, and a similar process is applied on any other desired time granularities (e.g., year). The condensed data may be generated for any combination of selected dimension(s) and grouping dimension(s).
机译:提供了一种用于支持和/或执行计数不同的查询的系统,方法和装置。每天会压缩大量数据(例如,数千万或数亿个事件记录)以生成状态位图,以反映一个或多个关键维度g1,g2, 。 。 。 (例如,广告ID,广告系列ID,广告客户ID)。缩合过程消除了重复,并为每个元组[S,g1,。。。提供了一个单一的值(例如1或0)。 。 。 ]代表S维中每个值与分组维中每个值组合的区别。在每月的基础上,将每日值压缩为一个月的单个值,并对任何其他所需的时间粒度(例如,年份)应用类似的过程。可以为所选维度和分组维度的任意组合生成压缩数据。

著录项

  • 公开/公告号US9128970B2

    专利类型

  • 公开/公告日2015-09-08

    原文格式PDF

  • 申请/专利权人 LINKEDIN CORPORATION;

    申请/专利号US201414284080

  • 发明设计人 SRINIVAS S. VEMURI;

    申请日2014-05-21

  • 分类号G06F7/00;G06F17/30;

  • 国家 US

  • 入库时间 2022-08-21 15:18:26

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号