首页> 外文会议>Language, Data, and Knowledge >Weak Supervision for Semi-supervised Topic Modeling via Word Embeddings
【24h】

Weak Supervision for Semi-supervised Topic Modeling via Word Embeddings

机译:通过词嵌入对半监督主题建模的弱监督

获取原文
获取原文并翻译 | 示例

摘要

Semi-supervised algorithms have been shown to improve the results of topic modeling when applied to unstructured text corpora. However, sufficient supervision is not always available. This paper proposes a new process, Weak+, suitable for use in semi-supervised topic modeling via matrix factorization, when limited supervision is available. This process uses word embeddings to provide additional weakly-labeled data, which can result in improved topic modeling performance.
机译:当应用于非结构化文本语料库时,已证明半监督算法可改善主题建模的结果。但是,并不总是有足够的监督。本文提出了一种新的过程Weak +,适用于在有限监督可用的情况下通过矩阵分解进行半监督主题建模的过程。此过程使用单词嵌入来提供其他标记较弱的数据,这可以提高主题建模的性能。

著录项

  • 来源
    《Language, Data, and Knowledge》|2017年|150-155|共6页
  • 会议地点 Galway(IE)
  • 作者

    Gerald Conheady; Derek Greene;

  • 作者单位

    School of Computer Science, University College Dublin, Dublin, Ireland;

    School of Computer Science, University College Dublin, Dublin, Ireland;

  • 会议组织
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

  • 入库时间 2022-08-26 14:01:11

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号