首页> 外国专利> Parallel bootstrap aggregating in a data warehouse appliance

Parallel bootstrap aggregating in a data warehouse appliance

机译:并行引导在数据仓库设备中聚合

摘要

A method of bootstrap sampling a dataset is described. With a process node, a series of random integers is generated. An assignment map is created. The assignment map includes a row identifier for each row of data of the dataset. A plurality of bootstrap sample identifiers defined by the series are assigned to at least one row identifier. An output table created from the assignment map. Rows of the output table include each instance of the bootstrap sample identifiers, the row identifier assigned with the bootstrap sample identifier, and data of the row.
机译:描述了一种采样数据集的引导方法。 使用流程节点,生成一系列随机整数。 创建分配映射。 分配映射包括用于数据集的每行数据的行标识符。 由该系列定义的多个引导示例标识符被分配给至少一行标识符。 从分配映射创建的输出表。 输出表的行包括引导示例标识符的每个实例,排序为引导样本标识符和行的数据分配的行标识符。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号