【24h】

A data mining approach to topic-specific web resource discovery

机译:一种用于特定主题的Web资源发现的数据挖掘方法

获取原文

摘要

The rapid growth of World Wide Web in recent years has made it important to carry out resource discovery Topic specific web crawler collects relevant web pages of interested topics from the lnternet, there are many relevant researches focusing on topic-specific crawling. However few works detail the topic-specific crawling with the user interests. In this paper, we present a new user interests model to optimize the performance of the topic-specific crawler. The crawler can learn from the previous experience to improve the proportion of the number of relevant pages and the number of the whole pages by using the user information, which is collected by data mining approach.
机译:近年来,万维网的快速发展使得进行资源发现变得非常重要。主题特定的Web爬虫从Internet收集感兴趣的主题的相关网页,有许多相关研究集中在主题特定的爬虫上。但是,很少有作品详细介绍与用户兴趣有关的特定于主题的爬网。在本文中,我们提出了一个新的用户兴趣模型,以优化主题特定爬网程序的性能。爬虫可以从以前的经验中学到,可以通过使用数据挖掘方法收集的用户信息来提高相关页面数的比例和整个页面数的比例。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号