首页> 中国专利> 一种面向实时新闻内容的流式话题演化跟踪方法

一种面向实时新闻内容的流式话题演化跟踪方法

摘要

本发明公开了一种面向实时新闻内容的流式话题演化跟踪方法,首先把实时采集的新闻内容,按时间段进行分批,对每一批新闻内容采用LDA方法挖掘初步话题结果;接着,在这一批新闻内容内部进行命名实体识别,并计算话题与实体间关联,以此更新实体库中的实体链接关系;然后,通过话题内部词项聚类,得到话题‑话题内类簇对应关系,并将话题结果存入话题库;最后,计算话题及其内部类簇的热度信息,并根据热度信息对LDA话题挖掘参数进行动态更新,供下一批新闻内容的话题演化跟踪使用。本发明可挖掘实时新闻内容中的话题特征以及话题内词项的类簇特征,充分利用话题间以及话题内不同类簇间的差异性,对LDA话题挖掘参数进行动态更新。

著录项

  • 公开/公告号CN108509517B

    专利类型发明专利

  • 公开/公告日2021-05-11

    原文格式PDF

  • 申请/专利权人 东南大学;

    申请/专利号CN201810195967.8

  • 发明设计人 杨鹏;张成帅;李幼平;张长江;

    申请日2018-03-09

  • 分类号G06F16/35(20190101);G06F16/36(20190101);G06F16/9535(20190101);G06F40/295(20200101);G06F40/30(20200101);

  • 代理机构32204 南京苏高专利商标事务所(普通合伙);

  • 代理人李玉平

  • 地址 211189 江苏省南京市江宁区东南大学路2号

  • 入库时间 2022-08-23 11:47:00

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号