【24h】

Multi-Document Summarization using Sentence-based Topic Models

机译:使用基于句子的主题模型进行多文档摘要

获取原文

摘要

Most of the existing multi-document summarization methods decompose the documents into sentences and work directly in the sentence space using a term-sentence matrix. However, the knowledge on the document side, i.e. the topics embedded in the documents, can help the context understanding and guide the sentence selection in the summarization procedure. In this paper, we propose a new Bayesian sentence-based topic model for summarization by making use of both the term-document and term-sentence associations. An efficient variational Bayesian algorithm is derived for model parameter estimation. Experimental results on benchmark data sets show the effectiveness of the proposed model for the multi-document summarization task.
机译:大多数现有的多文档摘要方法将文档分解为句子,并使用术语句子矩阵直接在句子空间中工作。但是,文档方面的知识,即文档中嵌入的主题,可以帮助上下文理解并指导摘要过程中的句子选择。在本文中,我们提出了一个新的基于贝叶斯句子的主题模型,该模型通过使用术语-文档和术语-句子关联来进行汇总。导出了一种有效的变分贝叶斯算法,用于模型参数估计。在基准数据集上的实验结果表明,该模型对于多文档摘要任务的有效性。

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号