【24h】

Topics in 0-1 Data

机译:0-1数据中的主题

获取原文
获取外文期刊封面目录资料

摘要

Large 0-1 datasets arise in various applications, such as market basket analysis and information retrieval. We concentrate on the study of topic models, aiming at results which indicate why certain methods succeed or fail. We describe simple algorithms for finding topic models from 0-1 data. We give theoretical results showing that the algorithms can discover the epsilon-separable topic models of Papadimitriou et al. We present empirical results showing that the algorithms find natural topics in real-world data sets. We also briefly discuss the connections to matrix approaches, including nonnegative matrix factorization and independent component analysis.
机译:大型0-1数据集出现在各种应用中,例如市场分析和信息检索。我们专注于主题模型的研究,其目标是表明某些方法成功或失败的原因。我们描述了用于从0-1数据中查找主题模型的简单算法。我们给出的理论结果表明,该算法可以发现Papadimitriou等人的与epsilon分离的主题模型。我们提供的经验结果表明,该算法在现实世界的数据集中找到了自然的话题。我们还将简要讨论与矩阵方法的联系,包括非负矩阵分解和独立分量分析。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号