首页> 外文期刊>Software >UbiCrawler: a scalable fully distributed Web crawler
【24h】

UbiCrawler: a scalable fully distributed Web crawler

机译:UbiCrawler:可扩展的完全分布式Web搜寻器

获取原文
获取原文并翻译 | 示例
       

摘要

We report our experience in implementing UbiCrawler, a scalable distributed Web crawler, using the Java programming language. The main features of UbiCrawler are platform independence, linear scalability, graceful degradation in the presence of faults, a very effective assignment function (based on consistent hashing) for partitioning the domain to crawl, and more in general the complete decentralization of every task. The necessity of handling very large sets of data has highlighted some limitations of the Java APIs, which prompted the authors to partially reimplement them.
机译:我们报告使用Java编程语言实现UbiCrawler(可伸缩的分布式Web搜寻器)的经验。 UbiCrawler的主要功能是平台独立性,线性可伸缩性,出现故障时的平稳降级,用于对要爬网的分区进行分区的非常有效的分配功能(基于一致的哈希),以及更一般而言,每个任务的完全分散化。处理大量数据的必要性凸显了Java API的一些局限性,促使作者部分重新实现了它们。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号