首页> 中国专利> 基于scrapy框架的房地产数据爬虫方法及装置

基于scrapy框架的房地产数据爬虫方法及装置

摘要

本发明公开了一种基于scrapy框架的房地产数据爬虫方法,包括:特征提取步骤,对目标网页的数据进行分析,提取所述目标网页中房地产数据的位置特征及结构特征;代码生成步骤,根据所述目标网页构建相应的项目,根据所述位置特征及所述结构特征生成基于scrapy框架的爬虫代码;数据爬取步骤,在scrapy文件集的setting文件中设置信息头将本地IP地址转换成正常的访问地址,根据所述爬虫代码,爬取所述房地产数据并按预设的规则保存。本发明通过对网页数据分析提取特征,根据特征自动生成相应爬虫代码,爬取房地产数据并保存,可便捷提取大量繁多网页中的房地产数据,节省用户时间,提供给用户便捷的查询方式,便于用户根据数据进行行业分析作出决策。

著录项

  • 公开/公告号CN113515681A

    专利类型发明专利

  • 公开/公告日2021-10-19

    原文格式PDF

  • 申请/专利权人 广东科学技术职业学院;

    申请/专利号CN202110481318.6

  • 发明设计人 刘晓林;龙巧玲;牛德雄;吴梓杰;

    申请日2021-04-30

  • 分类号G06F16/951(20190101);G06F16/958(20190101);

  • 代理机构44205 广州嘉权专利商标事务所有限公司;

  • 代理人尹凡华

  • 地址 519090 广东省珠海市金湾区珠海大道南侧

  • 入库时间 2023-06-19 12:54:37

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号