首页> 中国专利> 基于时序分布信息和主题模型的新闻事件演化分析方法

基于时序分布信息和主题模型的新闻事件演化分析方法

摘要

本发明“基于时序分布信息和主题模型的新闻事件演化分析方法”,涉及文本分析领域。首先通过分析新闻报道在时间序列上表现出来的分布特征,并利用K‑Means聚类算法,将语料库按时间划分成几个子语料库;然后利用主题模型依次对每个子语料库进行主题建模,通过Gibbs抽样的方法将模型学习出来,得到每个子语料的主题分布信息;最后通过计算相邻子语料库中两两主题之间的Jensen‑Shannon距离,取距离最小的主题串联起来,被串联起来的主题便是该事件的主主题,每个子语料中除了主主题之外的辅助主题,便是该事件在各个阶段的关注点和新的发展。能更好地刻画新闻预料中事件发展的主线以及在各个阶段爆发出来的新的关注点。

著录项

  • 公开/公告号CN103984681B

    专利类型发明专利

  • 公开/公告日2017-01-25

    原文格式PDF

  • 申请/专利权人 同济大学;

    申请/专利号CN201410127095.3

  • 发明设计人 王俊丽;王志成;赵卫东;王坚;

    申请日2014-03-31

  • 分类号G06F17/27(20060101);

  • 代理机构31216 上海天协和诚知识产权代理事务所;

  • 代理人叶凤

  • 地址 200092 上海市杨浦区四平路1239号

  • 入库时间 2022-08-23 09:51:34

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-01-25

    授权

    授权

  • 2014-09-10

    实质审查的生效 IPC(主分类):G06F 17/27 申请日:20140331

    实质审查的生效

  • 2014-08-13

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号