【24h】

Interpretable Topic Extraction and Word Embedding Learning Using Row-Stochastic DEDICOM

机译:使用行随机DEDICOM的可解释主题提取和词嵌入学习

获取原文

摘要

The DEDICOM algorithm provides a uniquely interpretable matrix factorization method for symmetric and asymmetric square matrices. We employ a new row-stochastic variation of DEDICOM on the pointwise mutual information matrices of text corpora to identify latent topic clusters within the vocabulary and simultaneously learn interpretable word embeddings. We introduce a method to efficiently train a constrained DEDICOM algorithm and a qualitative evaluation of its topic modeling and word embedding performance.
机译:DEDICOM算法为对称和非对称平方矩阵提供了一种唯一可解释的矩阵分解方法。我们在文本语料库的点向互信息矩阵上采用DEDICOM的新的行随机变型,以识别词汇中的潜在主题簇,同时学习可解释的词嵌入。我们介绍了一种有效地训练约束DEDICOM算法的方法,并对其主题建模和词嵌入性能进行了定性评估。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号