首页> 外国专利> Resource download policies based on user browsing statistics

Resource download policies based on user browsing statistics

机译:基于用户浏览统计信息的资源下载策略

摘要

Web crawling polices are generated based on user web browsing statistics. User browsing statistics are aggregated at the granularity of resource identifier patterns (such as URL patterns) that denote groups of resources within a particular domain or website that share syntax at a certain level of granularity. The web crawl policies rank the resource identifier patterns according to their associated aggregated user browsing statistics. A crawl ordering defined by the web crawl polices is used to download and discover new resources within a domain or website.
机译:Web爬网策略是基于用户Web浏览统计信息生成的。用户浏览统计信息以资源标识符模式(例如URL模式)的粒度进行汇总,这些粒度表示特定域或网站内以特定粒度级别共享语法的资源组。 Web爬网策略根据资源标识符模式的关联聚合用户浏览统计信息对其进行排名。 Web爬网策略定义的爬网顺序用于下载和发现域或网站内的新资源。

著录项

  • 公开/公告号US9495453B2

    专利类型

  • 公开/公告日2016-11-15

    原文格式PDF

  • 申请/专利权人 RUI CAI;XIAODONG FAN;LEI ZHANG;

    申请/专利号US201113114643

  • 发明设计人 RUI CAI;XIAODONG FAN;LEI ZHANG;

    申请日2011-05-24

  • 分类号G06F7;G06F17/30;G06F17;

  • 国家 US

  • 入库时间 2022-08-21 13:42:41

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号