首页> 中国专利> 一种基于平滑短语主题模型的主题提取方法及装置

一种基于平滑短语主题模型的主题提取方法及装置

摘要

本发明实施例提供一种基于平滑短语主题模型的主题提取方法及装置,包括:提取待处理数据集内的有效词,得到预处理数据集;通过Apriori关联算法自预处理数据集中提取出频繁短语,形成频繁短语数据集;根据频繁短语出现频率的高斯分布特性,将预处理数据集中符合预设要求的相邻的频繁短语组合成新的短语,并将新的短语加入到频繁短语数据集,形成候选短语数据集;通过SPLDA平滑短语主题模型对候选短语数据集进行分析,得到主题短语,通过主题短语形成相应的话题。通过平滑短语主题模型对候选短语数据集进行分析得到主题短语,通过主题短语形成相应的话题,提高了话题的可读性,更准确地表述了话题的真实信息。

著录项

  • 公开/公告号CN111178048A

    专利类型发明专利

  • 公开/公告日2020-05-19

    原文格式PDF

  • 申请/专利权人 微梦创科网络科技(中国)有限公司;

    申请/专利号CN201911421842.3

  • 发明设计人 郭佳;张景鹏;徐路;李油;赵小琦;

    申请日2019-12-31

  • 分类号

  • 代理机构北京卓岚智财知识产权代理事务所(特殊普通合伙);

  • 代理人蔡永波

  • 地址 100193 北京市海淀区东北旺西路中关村软件园二期(西扩)N-1、N-2地块新浪总部科研楼2层

  • 入库时间 2023-12-17 10:33:22

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-06-12

    实质审查的生效 IPC(主分类):G06F40/216 申请日:20191231

    实质审查的生效

  • 2020-05-19

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号