首页> 中国专利> 一种有争议性新闻线索自动发现的方法及系统

一种有争议性新闻线索自动发现的方法及系统

摘要

本发明公开了一种有争议性新闻线索自动发现的方法及系统,该方法包括:步骤1,利用预设的初始文本对一文本集进行检索,获得多个检索文本;步骤2,对该多个检索文本进行聚类,对每一类的检索文本分别执行摘要提取算法,以获得该类的线索文本;步骤3,利用每类的该线索文本进行检索,获得每类的多个扩充文本;步骤4,利用每类的该多个扩充文本进行特征提取,基于一预设的打分模型对提取得到的每类的特征进行打分,分数高于一阈值的类所对应的线索文本为有争议的新闻线索。本发明可从大量文本中自动发现有争议新闻线索,实现了海量信息的深层信息挖掘,且可不断完善信息挖掘的准确度、有效性。

著录项

  • 公开/公告号CN106372083B

    专利类型发明专利

  • 公开/公告日2019-10-18

    原文格式PDF

  • 申请/专利权人 中国科学院计算技术研究所;

    申请/专利号CN201510435105.4

  • 发明设计人 曹娟;张勇东;张俊强;李锦涛;

    申请日2015-07-22

  • 分类号

  • 代理机构北京律诚同业知识产权代理有限公司;

  • 代理人祁建国

  • 地址 100190 北京市海淀区中关村科学院南路6号

  • 入库时间 2022-08-23 10:41:16

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-10-18

    授权

    授权

  • 2017-03-01

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20150722

    实质审查的生效

  • 2017-03-01

    实质审查的生效 IPC(主分类):G06F 17/30 申请日:20150722

    实质审查的生效

  • 2017-02-01

    公开

    公开

  • 2017-02-01

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号