首页> 中国专利> 一种基于党校科研工作主题的网络爬虫系统和方法

一种基于党校科研工作主题的网络爬虫系统和方法

摘要

本发明公开了一种基于党校科研工作主题的网络爬虫系统和方法,涉及互联网搜索引擎技术领域。本发明的网络爬虫系统包括初始种子模块、爬行模块、数据库、主题相关度分析模块、排序模块、主题确立模块;网络爬虫工作方法包括:1、爬虫模块取回网页;2、调用相关度分析模块对网页进行相关度分析;3、爬行模块根据分析的结果进行网页剔除或保留动作;4、爬行模块从数据库中取出等待处理的URL;5、排序模块对网页的重要程度进行排序;6、爬行模块判断数据库中是否有新的URL。本发明通过建立一个党校科研工作主题的搜索引擎,利用主题相关度分析模块进行主题优化和网页过滤,提高了党校科研工作网页搜索的相关度和搜索信息的精准度。

著录项

  • 公开/公告号CN108959576A

    专利类型发明专利

  • 公开/公告日2018-12-07

    原文格式PDF

  • 申请/专利权人 合肥明高软件技术有限公司;

    申请/专利号CN201810736630.3

  • 发明设计人 徐玉红;

    申请日2018-07-06

  • 分类号G06F17/30(20060101);

  • 代理机构31253 上海精晟知识产权代理有限公司;

  • 代理人冯子玲

  • 地址 230000 安徽省合肥市高新区天智路19号

  • 入库时间 2023-06-19 07:34:02

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-01-01

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20180706

    实质审查的生效

  • 2018-12-07

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号