首页> 中国专利> 爬虫系统中解析规则配置方法及装置

爬虫系统中解析规则配置方法及装置

摘要

本申请涉及一种用于爬虫系统中解析规则配置方法,该方法包括:从监测站点获取页面数据;预设多个解析算法并逐一对页面数据进行解析;将每个解析算法解析出的结果进行对比,筛选出解析结果正确的解析算法;比较每个所述解析结果正确的解析算法的解析效率;根据所述解析效率确定最终解析算法,并将所述最终解析算法配置到所述监测站点。本申请避免通过人工配置解析规则导致配置耗时、耗力、效率低下的问题,并且提高了解析准确率。

著录项

  • 公开/公告号CN109325166A

    专利类型发明专利

  • 公开/公告日2019-02-12

    原文格式PDF

  • 申请/专利权人 真相网络科技(北京)有限公司;石松;

    申请/专利号CN201811117663.6

  • 发明设计人 石松;孙志国;

    申请日2018-09-21

  • 分类号G06F16/953(20190101);

  • 代理机构11471 北京细软智谷知识产权代理有限责任公司;

  • 代理人付登云

  • 地址 100020 北京市朝阳区望京利泽东园308号1单元5层504

  • 入库时间 2024-02-19 06:52:35

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-03-08

    实质审查的生效 IPC(主分类):G06F16/953 申请日:20180921

    实质审查的生效

  • 2019-02-12

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号