首页> 外文期刊>Applied Soft Computing >SCTWC: An online semi-supervised clustering approach to topical web crawlers
【24h】

SCTWC: An online semi-supervised clustering approach to topical web crawlers

机译:SCTWC:主题网络爬虫的在线半监督聚类方法

获取原文
获取原文并翻译 | 示例
       

摘要

Focused web crawlers collect topic-related web pages from the Internet. Using Q learning and semi-supervised learning theories, this study proposes an online semi-supervised clustering approach for topical web crawlers (SCTWC) to select the most topic-related URL to crawl based on the scores of the URLs in the unvisited list. The scores are calculated based on the fuzzy class memberships and the Q values of the unlabelled URLs. Experimental results show that SCTWC increases the crawling performance.
机译:重点突出的网络爬虫从Internet收集与主题相关的网页。本研究使用Q学习和半监督学习理论,为主题网络爬网程序(SCTWC)提出了一种在线半监督聚类方法,以基于未访问列表中URL的得分选择与主题相关性最高的URL进行爬网。根据模糊类成员资格和未标记URL的Q值计算分数。实验结果表明,SCTWC可以提高爬网性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号