首页> 中文期刊>计算机工程与应用 >一种基于LDA模型的主题句抽取方法

一种基于LDA模型的主题句抽取方法

     

摘要

This paper proposes a novel topic sentence extraction approach based on model LDA on basis of acquiring candidate topic sentences through the topic-related and query-based keyword expansion. It can extract fine granularity on the subject and increase the reliability of the certain topical information. On several sub-topics against a target topic, it extracts those topic sentences by means of the reliability calculation according to the smoothness of the topic-sentence probability distribution. The method achieves good result in the special application of sentence extraction on web topic.%在基于Web的主题关键词查询扩展,获取候选主题句的基础上,提出一种基于LDA模型的主题句抽取方法,以抽取粒度较细的主题信息,并增加主题信息的置信度.该方法通过多个侧面对目标主题的衬托,采用LDA模型对主题信息进行建模,利用各个主题概率分布的平滑度进行候选句的可信度计算来抽取主题句.在面向Web的主题句抽取的具体应用中,取得了较好的效果.

著录项

  • 来源
    《计算机工程与应用》|2013年第2期|160-164257|共6页
  • 作者

    王力; 李培峰; 朱巧明;

  • 作者单位

    苏州大学计算机科学和技术学院,江苏苏州215006;

    江苏省计算机信息处理技术重点实验室,江苏苏州215006;

    苏州大学计算机科学和技术学院,江苏苏州215006;

    江苏省计算机信息处理技术重点实验室,江苏苏州215006;

    苏州大学计算机科学和技术学院,江苏苏州215006;

    江苏省计算机信息处理技术重点实验室,江苏苏州215006;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 TP391.12;
  • 关键词

    隐含狄利克雷分配(LDA); 主题模型; 主题句抽取; 信息融合;

  • 入库时间 2023-07-24 17:05:43

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号