首页> 中国专利> 一种网络爬虫的爬行方法及装置

一种网络爬虫的爬行方法及装置

摘要

本发明公开了一种网络爬虫的爬行方法及装置,其涉及多台目标任务分配服务器和目标爬行服务器,其中该爬行方法包括:获取目标爬行任务列表,目标爬行任务列表包括多个爬行任务及每个爬行任务对应的爬行地址;根据预设分配规则,将多个爬行任务分配给各台目标任务分配服务器,并对每台目标任务分配服务器领取的爬行任务进行去重处理;根据预设交付规则,将去重处理后的每台目标任务分配服务器对应的爬行任务和对应的爬行地址交付给目标爬行服务器。本发明解决了现有技术中的以下问题:单机版的网络爬虫容易导致单机死机,多线程的网络爬虫局限于一台运行服务器上,并且容易出现重复的爬行结果。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-06-02

    实质审查的生效 IPC(主分类):G06F16/951 申请日:20191224

    实质审查的生效

  • 2020-05-08

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号