首页> 中文期刊> 《苏州大学学报(工科版)》 >Deep Web爬虫的一种增量式更新策略

Deep Web爬虫的一种增量式更新策略

         

摘要

为了在网络及计算机硬件等资源有限的前提下,最大限度地保证本地副本的"新鲜"程度,往往需要为Deep Web爬虫定制一个重爬机制。为了满足这种需求,提出了一种基于采样的增量式Deep Web更新方法,使用贪心策略分配爬虫资源,以最大限地的提高资源利用率。经实验验证,该方法取得了比较优异的结果。%In the context of network and computer hardware resources,in order to to ensure the maximum "fresh" level of local copy,we need to design an unpdate method for crawler.To meet the demands,we propose a sampling based incremental Deep Web update method.This method uses the greedy strategy to allocate crawler resources for achieving maximum resource utilization.We verify this method experimentally to obtain excellent results comparation.

著录项

  • 来源
    《苏州大学学报(工科版)》 |2011年第4期|6-10|共5页
  • 作者单位

    苏州大学智能信息处理及应用研究所,江苏苏州215006;

    苏州大学智能信息处理及应用研究所,江苏苏州215006;

    苏州大学智能信息处理及应用研究所,江苏苏州215006;

    苏州大学智能信息处理及应用研究所,江苏苏州215006;

    江苏省现代企业信息化应用支撑软件工程技术研发中心,江苏苏州215104;

    苏州大学智能信息处理及应用研究所,江苏苏州215006;

    江苏省现代企业信息化应用支撑软件工程技术研发中心,江苏苏州215104;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 检索机;
  • 关键词

    Deep; Web; 数据爬虫; 增量更新;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号