【24h】

How Text Segmentation Algorithms Gain from Topic Models

机译:文本分段算法如何获得主题模型

获取原文

摘要

This paper introduces a general method to incorporate the LDA Topic Model into text segmentation algorithms. We show that semantic information added by Topic Models significantly improves the performance of two word-based algorithms, namely TextTiling and C99. Additionally, we introduce the new TopicTil-ing algorithm that is designed to take better advantage of topic information. We show consistent improvements over word-based methods and achieve state-of-the art performance on a standard dataset.
机译:本文介绍了将LDA主题模型纳入文本分段算法的一般方法。我们表明主题模型添加的语义信息显着提高了两个基于Word的算法的性能,即TextIng和C99。此外,我们介绍了新的突然间算法,旨在提高主题信息的优势。我们通过基于文字的方法显示一致的改进,并在标准数据集上实现最先进的性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号