首页> 外国专利> MULTI-LEVEL RESERVOIR SAMPLING OVER DISTRIBUTED DATABASES AND DISTRIBUTED STREAMS

MULTI-LEVEL RESERVOIR SAMPLING OVER DISTRIBUTED DATABASES AND DISTRIBUTED STREAMS

机译:分布式数据库和分布式流上的多级储层采样

摘要

A system and method for random sampling of distributed data, including distributed data streams. The system and method use a multi-level reservoir sampling technique that leverages the conventional reservoir sampling algorithm for distributed data or distributed data streams. The method establishes an intermediate reservoir for each distributed data source or data stream and populates the intermediate reservoirs with a sample of data elements received from each distributed data source or data stream. A final reservoir is established and data elements are randomly selected from each one of the intermediate reservoirs to populate the final reservoir.
机译:一种用于对包括分布式数据流的分布式数据进行随机采样的系统和方法。该系统和方法使用多级油藏采样技术,该技术利用常规油藏采样算法处理分布式数据或分布式数据流。该方法为每个分布式数据源或数据流建立一个中间存储库,并用从每个分布式数据源或数据流接收的数据元素样本填充中间存储库。建立最终存储库,并从每个中间存储库中随机选择数据元素以填充最终存储库。

著录项

  • 公开/公告号US2018181621A1

    专利类型

  • 公开/公告日2018-06-28

    原文格式PDF

  • 申请/专利权人 TERADATA US INC.;

    申请/专利号US201615388300

  • 申请日2016-12-22

  • 分类号G06F17/30;G06N7/00;

  • 国家 US

  • 入库时间 2022-08-21 12:58:40

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号