首页> 中国专利> 基于scrapy框架的房地产数据爬虫方法及装置

基于scrapy框架的房地产数据爬虫方法及装置

页面导航

摘要
著录项
相似文献

摘要

本发明公开了一种基于scrapy框架的房地产数据爬虫方法，包括：特征提取步骤，对目标网页的数据进行分析，提取所述目标网页中房地产数据的位置特征及结构特征；代码生成步骤，根据所述目标网页构建相应的项目，根据所述位置特征及所述结构特征生成基于scrapy框架的爬虫代码；数据爬取步骤，在scrapy文件集的setting文件中设置信息头将本地IP地址转换成正常的访问地址，根据所述爬虫代码，爬取所述房地产数据并按预设的规则保存。本发明通过对网页数据分析提取特征，根据特征自动生成相应爬虫代码，爬取房地产数据并保存，可便捷提取大量繁多网页中的房地产数据，节省用户时间，提供给用户便捷的查询方式，便于用户根据数据进行行业分析作出决策。

著录项

公开/公告号CN113515681A

专利类型发明专利
公开/公告日2021-10-19

原文格式PDF
申请/专利权人广东科学技术职业学院;
展开▼

申请/专利号CN202110481318.6
发明设计人刘晓林;龙巧玲;牛德雄;吴梓杰;
展开▼

申请日2021-04-30
分类号G06F16/951(20190101);G06F16/958(20190101);
代理机构44205 广州嘉权专利商标事务所有限公司;
代理人尹凡华
地址 519090 广东省珠海市金湾区珠海大道南侧
入库时间 2023-06-19 12:54:37

相似文献

专利
中文文献
外文文献

1. 基于scrapy框架的房地产数据爬虫方法及装置 [P] . 中国专利： CN113515681A . 2021-10-19
2. 一种基于Scrapy框架的网络数据的采集方法及装置 [P] . 中国专利： CN109614535B . 2021.10.08
3. CRAWLER DATA-BASED USER BEHAVIOR ANALYSIS METHOD, APPLICATION SERVER AND READABLE STORAGE MEDIUM [P] . 世界知识产权组织专利： WO2019071966A1 . 2019-04-18

机译：基于爬虫数据的用户行为分析方法，应用服务器和可读存储介质
4. CRAWLING METHOD AND SYSTEM THROUGH TEXT DATA MINING BASED ON DIFFUSION PREDICTION [P] . 韩国专利： KR101614736B1 . 2016-04-29

机译：基于扩散预测的文本数据挖掘爬虫方法及系统
5. Global positioning-based real estate database access device and method [P] . 美国专利： US6385541B1 . 2002-05-07

机译：基于全球定位的房地产数据库访问装置及方法