Focused Crawling; Information Content; Information Retrieval; Relevant Page Prediction; Web Data Mining;
机译:专注于爬网,这是一种用于主题特定的Web资源发现的新方法
机译:在线主题重要性估计:结合链路和内容分析的有效聚焦爬网算法
机译:在线主题重要性估计:结合链接和内容分析的有效集中式爬网算法
机译:通过引入术语频率信息内容(TF-IC)测量来改进聚焦爬网的多术目主题
机译:连接Web上的链接结构和内容,以进行有效的集中爬网。
机译:拼凑难题:使用自适应微博爬网改进事件内容的覆盖范围以进行实时子事件检测
机译:基于代理的聚焦爬行框架,用于与主题和流派相关的Web文档发现