首页> 中国专利> 基于概率模型的微博文本数据细粒度话题演化分析方法

基于概率模型的微博文本数据细粒度话题演化分析方法

摘要

本发明属于文本挖掘和话题发现与跟踪领域,涉及一种基于概率模型的微博文本数据的细粒度话题演化分析方法,步骤为:(S1)根据事件关键词搜索获取讨论同一事件的博文,得到微博文本集;(S2)选择固定的时间间隔值,按照时间间隔将微博文本集中博文发布的时间跨度划分为若干个时间片,分别将预处理后的博文映射到每个时间片内;(S3)提取用户感兴趣目标方向的细粒度话题,并计算得到相应的话题‑词的概率分布和文档‑话题的概率分布;(S4)保持话题在时间片之间的连续性;(S5)计算每个时间片内每个文档‑话题的概率分布的平均值,得到同一事件的细粒度话题演化图。本发明提升了事件的细粒度话题演化分析方法的精度和质量。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-10-27

    实质审查的生效 IPC(主分类):G06F17/27 申请日:20170606

    实质审查的生效

  • 2017-09-26

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号