首页> 中国专利> 一种基于图片验证码识别的网络爬虫方法

一种基于图片验证码识别的网络爬虫方法

摘要

本发明公开了一种基于图片验证码识别的网络爬虫方法,包括:爬虫程序的预处理和构建;计算机加载爬虫程序,使用浏览器访问网页;在网络请求超时、代理IP被限制访问、出现图片验证码时,由爬虫程序进行不同处理,在访问到爬虫需要爬取的网页时,将网页的内容下载并保存。本发明可以在被爬取的网站使用图片验证码限制网络爬虫爬取网站内容时,通过人工识别图片验证码,使得爬虫可以继续爬取网页。

著录项

  • 公开/公告号CN108062468B

    专利类型发明专利

  • 公开/公告日2021-08-24

    原文格式PDF

  • 申请/专利权人 南京烽火星空通信发展有限公司;

    申请/专利号CN201711415807.1

  • 发明设计人 闵信志;刘计争;高成俊;

    申请日2017-12-25

  • 分类号G06F21/36(20130101);G06F16/951(20190101);

  • 代理机构32200 南京经纬专利商标代理有限公司;

  • 代理人杨海军

  • 地址 210019 江苏省南京市建邺区云龙山路88号烽火科技大厦A栋26F

  • 入库时间 2022-08-23 12:22:14

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号