基于Scrapy的大数据学情分析系统就业岗位数据爬取

汪邦博; 胡必波; 李满; 刘丝雨; 刘晓莉

首页> 中文期刊> 《电脑编程技巧与维护》 >基于Scrapy的大数据学情分析系统就业岗位数据爬取

基于Scrapy的大数据学情分析系统就业岗位数据爬取

AI论文写作 >>

开具论文收录证明 >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

大数据学情分析系统开发主要涉及构建大数据平台、采集岗位信息、数据存储、数据处理、数据分析、数据可视化、上线部署等关键环节.其中,采集岗位信息环节需要借助Scrapy爬虫框架从招聘网站采集就业岗位数据,配置爬虫数据萃取表达式,对采集到的HTML内容提取出csv格式,数据内容包括岗位、公司、月薪、福利、职位描述、职位要求等.对采集数据进行简单的筛选,保留有价值的信息.在资源条件有限的前提下突破网站的反爬策略实现数据爬取是一个难题,以实现某网站爬虫为具体案例,简要介绍从需求分析、设计方案以及具体技术实现过程,并对爬取过程中页面结构不一致、边界、去重、突破反爬机制等问题进行总结.

著录项

来源
《电脑编程技巧与维护》 |2021年第11期|92-93,120|共3页
作者
汪邦博; 胡必波; 李满; 刘丝雨; 刘晓莉;
展开▼
作者单位

广州工商学院工学院广州510850;

广州工商学院工学院广州510850;

广州工商学院工学院广州510850;

广州工商学院工学院广州510850;

广州工商学院工学院广州510850;

展开▼
原文格式 PDF
正文语种 chi
中图分类
关键词
大数据; 爬虫; Python语言; Scrapy框架;

相似文献

中文文献
外文文献
专利

1. 基于Scrapy和Hadoop平台的房屋价格数据爬取和存储系统 [J] . 丁志毅1 . 电子技术与软件工程 . 2019,第017期
2. 基于Scrapy框架京东网站笔记本电脑评论数据爬取和分析 [J] . 方芳 . 电脑知识与技术 . 2020,第006期
3. 基于Scrapy的农业网络数据爬取 [J] . 李乔宇 ,尚明华 ,王富军 . 山东农业科学 . 2018,第001期
4. 基于Scrapy爬虫框架的领域网站文件爬取 [J] . 邹维 ,李廷元 . 现代信息科技 . 2020,第021期
5. 基于Scrapy爬虫框架的领域网站文件爬取 [J] . 邹维 ,李廷元 . 现代信息科技 . 2020,第021期
6. 大数据时代的网络爬取技术与信息安全策略探析 [C] . 郝耀鸿 . 2019互联网安全与治理论坛 . -1
7. 基于Scrapy爬取电商平台数据及自动问答系统的构建 [A] . 舒德华 . 2016

基于Scrapy的大数据学情分析系统就业岗位数据爬取

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅