您现在的位置:首页> 外军国防科技报告 >文献详情

【2h】A Novel Document Generation Process for Topic Detection Based on Hierarchical Latent Tree Models

机译基于分层潜树模型的主题检测新文档生成过程

【摘要】We propose a novel document generation process based on hierarchical latent tree models (HLTMs) learned from data. An HLTM has a layer of observed word variables at the bottom and multiple layers of latent variables on top. For each document, the generative process rst samples values for the latent variables layer by layer via logic sampling, then draws relative frequencies for the words conditioned on the values of the latent variables, and nally generates words for the document using the relative word frequencies. The motivation for this work is to take word counts into consideration with HLTMs. In comparison with LDA-based hierarchical document generation processes, the new process achieves drastically better model t with much fewer parameters. It also yields more meaningful topics and topic hierarchies. It is the new state- of-the-art for the hierarchical topic detection.

【摘要机译】我们提出了一种基于从数据中学到的分层潜树模型(HLTM)的新颖文档生成过程。 HLTM在底部有一层观察到的单词变量,在顶部有多层潜在变量。对于每个文档,生成过程首先通过逻辑采样逐层采样潜在变量的值,然后根据潜在变量的值绘制单词的相对频率,然后使用相对单词频率为文档最终生成单词。这项工作的动机是要考虑HLTM的字数统计。与基于LDA的分层文档生成过程相比,新过程以更少的参数实现了更好的模型t。它还会产生更有意义的主题和主题层次结构。这是用于分层主题检测的最新技术。

【作者】Chen, Peixian;Chen, Zhourong;Zhang, Nevin Lianwen;

【作者单位】

【年(卷),期】2019(),

【年度】2019

【页码】

【总页数】13

【原文格式】PDF

【正文语种】

【中图分类】

【网站名称】香港科技大学图书馆

【栏目名称】所有文件

【关键词】

  • 相关文献
  • 联系方式:18141920177 (微信同号) 客服邮箱:kefu@zhangqiaokeyan.com
  • 中文期刊 外文期刊
  • 京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-1 六维联合信息科技(北京)有限公司©版权所有
  • 客服微信
  • 服务号