Webpage deduplication; Vertical search engine;
机译:基于Hadoop的平台,用于自然语言处理网页和文档
机译:基于hadoop的平台,用于自然语言处理网页和文档
机译:Web文档分层聚类的基于图割的算法的并行化
机译:基于Hadoop的Web文档的并行重复数据删除方法
机译:Web文档群集:一种基于短语的方法,用于对搜索引擎结果进行分组。
机译:MR-Tandem:在Amazon Web Services上使用Hadoop MapReduce进行并行X!Tandem
机译:基于Hadoop的网页和文档的自然语言处理平台
机译:走向Webscale,基于规则的语义Web推理通过数据并行。