首页> 中国专利> 一种面向微博的非分词突发话题检测方法

一种面向微博的非分词突发话题检测方法

摘要

本发明涉及利用计算机技术辅助网络信息智能分析或舆情的一种面向微博的非分词突发话题检测方法。本发明包括:语料预处理,构建动态的微博检测窗口;将微博内容切分成单个汉字,并构建字典;计算突发特征字集合;计算由特征字组成的突发话题;生成有意义词或串,形成由词或串表示的突发话题。本发明提出了一种无须中文分词的微博突发话题检测方法,对中文微博消息内容事先不做中文分词,而是将汉字和英文单词、图片、视频、外部链接等作为单个实体。最后对突发特征实体中的中文汉字构词,能够提高检测方法的整体性能,提高对新词、口语化串的召回率。

著录项

  • 公开/公告号CN104216964B

    专利类型发明专利

  • 公开/公告日2018-03-13

    原文格式PDF

  • 申请/专利权人 哈尔滨工程大学;

    申请/专利号CN201410416127.1

  • 申请日2014-08-22

  • 分类号

  • 代理机构

  • 代理人

  • 地址 150001 黑龙江省哈尔滨市南岗区南通大街145号哈尔滨工程大学科技处知识产权办公室

  • 入库时间 2022-08-23 10:07:55

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-03-13

    授权

    授权

  • 2015-09-23

    著录事项变更 IPC(主分类):G06F17/30 变更前: 变更后: 申请日:20140822

    著录事项变更

  • 2015-01-07

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20140822

    实质审查的生效

  • 2014-12-17

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号