【24h】

Word Embedding-Based Topic Similarity Measures

机译:基于单词嵌入的主题相似度措施

获取原文
获取外文期刊封面目录资料

摘要

Topic models aim at discovering a set of hidden themes in a text corpus. A user might be interested in identifying the most similar topics of a given theme of interest. To accomplish this task, several similarity and distance metrics can be adopted. In this paper, we provide a comparison of the state-of-the-art topic similarity measures and propose novel metrics based on word embeddings. The proposed measures can overcome some limitations of the existing approaches, highlighting good capabilities in terms of several topic performance measures on benchmark datasets.
机译:主题模型旨在在文本语料库中发现一组隐藏的主题。 用户可能有兴趣识别给定主题的最相似的主题。 为完成此任务,可以采用几个相似性和距离度量。 在本文中,我们提供了最先进的主题相似度措施的比较,并提出了基于Word Embeddings的新颖度量。 拟议的措施可以克服现有方法的一些限制,突出了基于基准数据集的几个主题绩效措施的良好能力。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号