首页> 中国专利> 一种针对新闻媒体批量加密数据的采集方法

一种针对新闻媒体批量加密数据的采集方法

摘要

本发明公开了一种针对新闻媒体批量加密数据的采集方法,属于新闻媒体数据采集领域,包括步骤:S1,将数据库中的网址url、站名内容分别添加至由redis实现的url去重集合及由redis实现的url队列;S2,用puppeteer进程去消费由redis实现的url队列中的数据;S3,获取网页数据html,将其加入到由redis实现的html队列中,并将由redis实现的html队列标记区分为列表页网页数据html或内容页网页数据html;S4,解析由redis实现的html队列中的数据并处理。本发明更容易实现批量加密数据的采集,且具有效率高、成本低、维护容易等优点。

著录项

  • 公开/公告号CN113934914A

    专利类型发明专利

  • 公开/公告日2022-01-14

    原文格式PDF

  • 申请/专利权人 成都橙视传媒科技股份公司;

    申请/专利号CN202111557743.5

  • 发明设计人 李林;吴雷;孙于扬;

    申请日2021-12-20

  • 分类号G06F16/951(20190101);G06F16/955(20190101);

  • 代理机构51214 成都九鼎天元知识产权代理有限公司;

  • 代理人孙元伟

  • 地址 610000 四川省成都市高新区科园二路10号2栋2单元13层1号、2号

  • 入库时间 2023-06-19 13:54:12

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-01-14

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号