Internet; information retrieval; public domain software; Nutch open-source crawler; Web document gathering; advertisement activity; collective intelligence; distributed Web community crawler; marketing activity; Communities; Crawlers; Linux; Throughput; Uniform resource locators; Web pages; Distributed web crawler; community; web forum;
机译:分布式Web爬虫在信息管理系统中的应用。温|信息学
机译:使用Hadoop分布式Web爬虫器
机译:基于本体的爬虫,用于检索Web上分布的信息
机译:实施分布式网络社区爬虫
机译:用于企业数据抓取的智能Web搜寻器的设计和实现。
机译:面向用户的网络爬虫用于在电子卫生研究中选择性地获取在线内容
机译:Web搜索引擎的可扩展,完全分布式Web爬网程序的设计和实现