首页> 中文期刊>工业控制计算机 >基于Python多重解析的图像爬虫的设计与实现

基于Python多重解析的图像爬虫的设计与实现

     

摘要

深度学习已经被广泛应用在自然语言处理和图像识别领域.深度学习模型需要大量的训练数据,而大量的训练数据能够有效地防止模型的过拟合.图像情感分类研究基于社交媒体的海量图像集,这些数据集往往不直接提供图像下载,而采用记录图像地址信息的专有格式文件.这些文件通常存在非法字符、解析困难、图像真实地址隐藏等问题,这给图像地址解析和下载带来诸多困难.以Python为工具,研究多重解析技术解决非法字符、大容量文件标签遍历和解析图像真实地址问题,并利用异常处理和多线技术实现图像准确快速地下载,帮助研究人员方便地采集图像数据集.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号