首页> 外文会议>International Conference on Pattern Recognition >An Empirical Bayes Approach to Topic Modeling
【24h】

An Empirical Bayes Approach to Topic Modeling

机译:主题建模的经验贝叶斯方法

获取原文
获取外文期刊封面目录资料

摘要

Given a corpus of documents, we consider the problem of finding latent topics, and introduce a novel Empirical Bayes based framework that allows us to choose the optimal topic modeling algorithm given observed variables in the data. We specifically consider three disparate algorithms - LDA, graph clustering, and non-negative matrix factorization - and provide a standardized framework that compares statistical and generative assumptions each algorithm makes. We then provide a model selection algorithm that quantifies each model based on how well assumptions match the data. We illustrate the efficacy of our approach by applying our framework to different sets of document corpuses and empirically measuring results.
机译:鉴于文档语料库,我们考虑找到潜在主题的问题,并介绍了一种基于新的经验贝叶斯的框架,允许我们选择在数据中观察到的变量的最佳主题建模算法。 我们特别考虑三个不同的算法 - LDA,图形聚类和非负矩阵分解 - 并提供了一种标准化的框架,可比较每个算法的统计和生成假设。 然后,我们提供了一种模型选择算法,该算法根据假设匹配数据的良好程度来定量每个模型。 我们通过将我们的框架应用于不同的文件语料集和经验测量结果来说明我们的方法的效果。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号