首页> 外国专利> FREQUENT PATTERN ANALYSIS FOR DISTRIBUTED SYSTEMS

FREQUENT PATTERN ANALYSIS FOR DISTRIBUTED SYSTEMS

机译:分布式系统的频率模式分析

摘要

Methods, systems, and devices supporting frequent pattern (FP) analysis for distributed systems are described. Some database systems may analyze data sets to determine FPs within the data. However, because FP mining relies on combinatorics, very large data sets incur combinatorial explosion of the memory and processing resources needed to handle the FP analysis. To obtain the resources needed for FP analysis of large data sets, the database system may spin up multiple data processing machines and may distribute the FP mining process across these machines. The database system may distribute the data set according to a tradeoff between commonality and data attribute list length, efficiently utilizing the resources at each data processing machine. This may result in data subsets with either large numbers of data objects or large numbers of data attributes for data objects, but not both, limiting the combinatorial explosion and, correspondingly, limiting the resources required.
机译:描述了支持用于分布式系统的频繁模式(FP)分析的方法,系统和设备。一些数据库系统可能会分析数据集以确定数据中的FP。但是,由于FP挖掘依赖于组合技术,因此非常大的数据集会导致处理FP分析所需的内存和处理资源的组合爆炸式增长。为了获得大型数据集的FP分析所需的资源,数据库系统可以启动多个数据处理机器,并可以在这些机器之间分配FP挖掘过程。数据库系统可以根据通用性和数据属性列表长度之间的折衷来分配数据集,从而有效地利用每个数据处理机上的资源。这可能会导致数据子集具有大量数据对象或大量数据对象的数据属性,但不能同时包含这两者,从而限制了组合爆炸并相应地限制了所需的资源。

著录项

  • 公开/公告号US2019362016A1

    专利类型

  • 公开/公告日2019-11-28

    原文格式PDF

  • 申请/专利权人 SALESFORCE.COM INC.;

    申请/专利号US201816119955

  • 发明设计人 KEXIN XIE;YACOV SALOMON;

    申请日2018-08-31

  • 分类号G06F17/30;

  • 国家 US

  • 入库时间 2022-08-21 11:19:21

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号