首页> 外国专利> Highly scalable memory-efficient parallel LDA in a shared-nothing MPP database

Highly scalable memory-efficient parallel LDA in a shared-nothing MPP database

机译:无共享MPP数据库中的高度可扩展的内存高效并行LDA

摘要

Latent Dirichlet allocation (LDA) analysis on a dataset is performed on an MPP relational database by distributing subsets of said dataset to a plurality of segments of the MPP database, and performing LDA analysis in parallel on the respective subsets on the plurality of segments using Gibbs sampling. An object library on each segment provides executable objects of user defined functions that can be called by an SQL query when the query requires functionality provided by an object.
机译:通过将所述数据集的子集分布到MPP数据库的多个段,并使用Gi​​bbs并行地对多个段上的各个子集执行LDA分析,可以对MPP关系数据库执行数据集上的潜在Dirichlet分配(LDA)分析。采样。每个段上的对象库提供了用户定义函数的可执行对象,当查询需要对象提供的功能时,这些对象可以由SQL查询调用。

著录项

  • 公开/公告号US9317809B1

    专利类型

  • 公开/公告日2016-04-19

    原文格式PDF

  • 申请/专利权人 EMC CORPORATION;

    申请/专利号US201314037293

  • 申请日2013-09-25

  • 分类号G06F9/44;G06N7/02;G06N7/06;G06N5/04;G06N7/04;G06N7/00;G06N99/00;

  • 国家 US

  • 入库时间 2022-08-21 14:31:42

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号