首页> 中国专利> 一种基于LDA和随机森林的微博谣言识别方法

一种基于LDA和随机森林的微博谣言识别方法

摘要

本发明公开了一种基于LDA和随机森林的微博谣言识别方法,使用爬虫方法从微博官方平台上收集微博数据并进行人工标注;通过文本内容数据处理以及z‑score标准化微博数据以计算用户可信度特征和微博影响力特征;通过LDA优化文本内容与主题分布概率以及LDA主题与优化文本内容词语分布概率计算困惑度;进一步构建构建微博特征向量;通过用户可信度特征、微博影响力特征、LDA优化文本内容与主题分布概率作为随机森林模型的输入特征以建立微博谣言分类器。本发明深入挖掘了微博文本语义信息且谣言分类精度高。

著录项

  • 公开/公告号CN108090046A

    专利类型发明专利

  • 公开/公告日2018-05-29

    原文格式PDF

  • 申请/专利权人 武汉大学;

    申请/专利号CN201711483228.0

  • 发明设计人 曾子明;王婧;

    申请日2017-12-29

  • 分类号G06F17/27(20060101);G06F17/30(20060101);

  • 代理机构42222 武汉科皓知识产权代理事务所(特殊普通合伙);

  • 代理人薛玲

  • 地址 430072 湖北省武汉市武昌区珞珈山武汉大学

  • 入库时间 2023-06-19 05:28:32

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-06-22

    实质审查的生效 IPC(主分类):G06F17/27 申请日:20171229

    实质审查的生效

  • 2018-05-29

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号