基于分布式Docker群集的招聘网站职位数据持续爬取和分析

张梁斌; 柴晖; 王渊明; 万健

首页> 中文期刊>浙江万里学院学报 >基于分布式Docker群集的招聘网站职位数据持续爬取和分析

基于分布式Docker群集的招聘网站职位数据持续爬取和分析

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

许多大型在线求职平台由于招聘信息不统一,求职者难以在丰富冗余的求职信息中找到合适精准的信息.利用网页爬虫技术,设计实现了分布式Docker容器群集架构下招聘网站的职位数据持续爬取和分析展示.首先,利用Swarm容器管理工具构建多台物理主机的Docker群集;然后,利用Python的Scarpy框架对主流招聘网站的非结构化职位信息进行持续性分布式网络爬虫,涉及URL地址去重、数据采集、提取和清洗等,产生招聘职位的MYSQL数据库;最后,对求职数据库进行分析挖掘,生成职位数量分布热力图、岗位技能画像和可视化展示的统计图表,可为求职者提供直观的职位信息参考.

著录项

来源
《浙江万里学院学报》|2019年第2期|85-90|共6页
作者
张梁斌; 柴晖; 王渊明; 万健;
展开▼
作者单位

浙江万里学院, 浙江宁波 315100;

杭州电子科技大学, 浙江杭州, 310018;

浙江万里学院, 浙江宁波 315100;

浙江万里学院, 浙江宁波 315100;

杭州电子科技大学, 浙江杭州, 310018;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
招聘职位; 网页爬虫; Docker群集; Swarm; 可视化;
入库时间 2023-07-25 18:08:31

相似文献

中文文献
外文文献
专利

1. 基于Python的招聘网站信息爬取与数据分析 [J] . 刘晓知 . 电子测试 . 2020,第012期
2. 基于Python的招聘网站信息爬取与数据分析 [J] . 王芳 . 微型机与应用 . 2019,第008期
3. 基于Python的招聘网站信息爬取与数据分析 [J] . 王芳1 . 信息技术与网络安全 . 2019,第008期
4. 中国互联网金融职位特征与人才需求研究r——基于招聘网站数据的内容分析 [J] . 谢添轩 ,魏争 . 江苏科技信息 . 2017,第018期
5. 基于Scrapy框架京东网站笔记本电脑评论数据爬取和分析 [J] . 方芳 . 电脑知识与技术 . 2020,第006期
6. 基于Python的Web数据爬取分析及其开源解决方案 [C] . 梁昊鸣 ,李燕军 . 2016年全国工业控制计算机技术年会 . 2016
7. 基于增量式爬取和非文本内容评估的网站无障碍检测系统 [A] . 徐峰 . 2014

基于分布式Docker群集的招聘网站职位数据持续爬取和分析

摘要

著录项

相似文献

相关主题

期刊订阅