首页> 外国专利> FREQUENT PATTERN ANALYSIS FOR DISTRIBUTED SYSTEMS

FREQUENT PATTERN ANALYSIS FOR DISTRIBUTED SYSTEMS

机译:分布式系统频繁的图案分析

摘要

Methods, systems, and devices supporting frequent pattern (FP) analysis for distributed systems are described. Some database systems may analyze data sets to determine FPs within the data. However, because FP mining relies on combinatorics, very large data sets incur combinatorial explosion of the memory and processing resources needed to handle the FP analysis. To obtain the resources needed for FP analysis of large data sets, the database system may spin up multiple data processing machines and may distribute the FP mining process across these machines. The database system may distribute the data set according to a tradeoff between commonality and data attribute list length, efficiently utilizing the resources at each data processing machine. This may result in data subsets with either large numbers of data objects or large numbers of data attributes for data objects, but not both, limiting the combinatorial explosion and, correspondingly, limiting the resources required.
机译:描述了支持分布式系统的频繁模式(FP)分析的方法,系统和设备。某些数据库系统可以分析数据集以确定数据内的FPS。但是,由于FP挖掘依赖于组合学,因此非常大的数据集招致内存的组合爆炸和处理FP分析所需的处理资源。为了获得大数据集的FP分析所需的资源,数据库系统可以旋转多个数据处理机器,并可以在这些机器上分配FP采矿过程。数据库系统可以根据共性和数据属性列表长度之间的权衡分发数据集,高效地利用每个数据处理机器的资源。这可能导致具有大量数据对象或数据对象的大量数据属性的数据子集,但不对相应地限制组合爆炸,并相应地限制所需的资源。

著录项

  • 公开/公告号EP3803625A1

    专利类型

  • 公开/公告日2021-04-14

    原文格式PDF

  • 申请/专利权人 SALESFORCE.COM INC.;

    申请/专利号EP20190723944

  • 发明设计人 XIE KEXIN;SALOMON YACOV;

    申请日2019-04-29

  • 分类号G06F16/26;

  • 国家 EP

  • 入库时间 2022-08-24 18:12:54

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号