首页> 中国专利> 基于粒子模型话题分析算法的便携式网络舆情分析系统

基于粒子模型话题分析算法的便携式网络舆情分析系统

摘要

本发明涉及一种基于粒子模型话题分析的网络舆情分析方法,采用分布式集群的方式运行nutch网络爬虫获取当前互联网网页数据,并经过自然语言处理后将所有的网站数据进行分词并得到每一个特征词的权值,创建特征词权值表。AC自动机对特征词权值表通过特征词的相互匹配从而求得每一个特征词出现的频率进而获得特征词的IDF权值以及样本相互间根据特征词的关联系数。最终在剔除互联网网站数据的众多噪声点后,对有意义的网站样本按照讨论话题的不同分成多个话题簇。再将簇内的网站样本按照其重要性排序,通过反馈机制得到该话题簇的主题和最能代表该主题的样本,最后将这些样本展示给用户。

著录项

  • 公开/公告号CN108304571B

    专利类型发明专利

  • 公开/公告日2020-10-09

    原文格式PDF

  • 申请/专利权人 湘潭大学;

    申请/专利号CN201810154155.9

  • 申请日2018-02-22

  • 分类号G06F16/951(20190101);G06F16/906(20190101);G06Q50/00(20120101);

  • 代理机构11394 北京卓恒知识产权代理事务所(特殊普通合伙);

  • 代理人徐楼

  • 地址 411105 湖南省湘潭市雨湖区湘潭大学

  • 入库时间 2022-08-23 11:16:17

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号