基于Scrapy框架的分布式爬虫设计与实现

王芳; 张睿; 宫海瑞

首页> 中文期刊>信息技术 >基于Scrapy框架的分布式爬虫设计与实现

基于Scrapy框架的分布式爬虫设计与实现

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

网络爬虫是近些年来较为热门的技术之一,它被广泛应用于搜索引擎技术,现今技术不断发展成熟,爬虫不仅仅应用于搜索引擎的信息搜集,更多应用于定向信息的采集,比如房价、招聘信息、用户信息等等.文中以Python及其框架Scrapy环境为基础,以知乎网站为例,来爬取用户信息.通过使用Scrapy框架实现爬虫,分析整个爬取的原理,了解爬取的运行流程,特别对反爬虫策略进行优化,实现程序在远程服务器的部署,将信息存储到时下较为流行的No-SQL数据库中,最后对爬取数据进行分析与展示.

著录项

来源
《信息技术》|2019年第3期|96-101|共6页
作者
王芳; 张睿; 宫海瑞;
展开▼
作者单位

太原科技大学计算机科学与技术学院,太原030024;

太原科技大学计算机科学与技术学院,太原030024;

太原科技大学计算机科学与技术学院,太原030024;

展开▼
原文格式 PDF
正文语种 chi
中图分类计算机仿真;
关键词
网络爬虫; Scrapy; 分布式;
入库时间 2023-08-23 16:31:56

相似文献

中文文献
外文文献
专利

1. 基于Scrapy的分布式爬虫系统的设计与实现 [J] . 李代祎 ,谢丽艳 ,钱慎一 . 湖北民族学院学报（自然科学版） . 2017,第003期
2. 基于Django的分布式爬虫框架设计与实现 [J] . 赵宸 ,刘建华 . 计算机与数字工程 . 2020,第010期
3. 基于Python和Scrapy框架的网页爬虫设计与实现 [J] . 陈皓 ,周传生 . 电脑知识与技术 . 2021,第013期
4. 基于Scrapy框架的数据采集系统设计与实现 [J] . 郅芬香 ,王留芳 . 信息记录材料 . 2020,第007期
5. 基于Scrapy的网络爬虫系统框架设计与实现 [J] . 王磊 ,刘晓丹 . 微型电脑应用 . 2019,第004期
6. 基于SpringMVC框架的水库运行管理平台的设计与实现 [C] . 李文晶 . 2018（第六届）中国水利信息化论坛 . 2018
7. 基于Scrapy框架的分布式爬虫系统设计与实现 [A] . 汪兵 . 2019

基于Scrapy框架的分布式爬虫设计与实现

摘要

著录项

相似文献

相关主题

期刊订阅