首页> 外国专利> SYSTEMS AND METHODS FOR CATEGORIZING WEB PAGES AND USING CATEGORIZED WEB PAGES

SYSTEMS AND METHODS FOR CATEGORIZING WEB PAGES AND USING CATEGORIZED WEB PAGES

机译:用于对网页进行分类和使用分类的网页的系统和方法

摘要

Systems and methods for categorizing web pages and using categorized web pages are provided. The categorization involves using at least a master word list and one or more category word lists. The master word list tracks all words encountered by the system (except with the possible exception of natural words) and the category word lists includes words associated with a particular category. These lists can be initialized in a training phase and then the one or more category lists can be used to identify words in web pages matching words in one or more of the category lists. Based on this matching, as well as based on the master word list, a weight is generated for the web page, which is used to determine whether the web page belongs to a particular category.
机译:提供了用于对网页进行分类和使用经分类的网页的系统和方法。所述分类涉及至少使用主单词列表和一个或多个类别单词列表。主单词列表跟踪系统遇到的所有单词(自然单词可能除外),类别单词列表包括与特定类别关联的单词。可以在训练阶段中初始化这些列表,然后可以使用一个或多个类别列表来识别网页中与一个或多个类别列表中的单词匹配的单词。基于此匹配以及基于主单词列表,为网页生成权重,该权重用于确定网页是否属于特定类别。

著录项

  • 公开/公告号US2018137135A1

    专利类型

  • 公开/公告日2018-05-17

    原文格式PDF

  • 申请/专利权人 SOCIAL NETWORKING TECHNOLOGY INC.;

    申请/专利号US201715811792

  • 发明设计人 TIMOTHY WALTON;

    申请日2017-11-14

  • 分类号G06F17/30;

  • 国家 US

  • 入库时间 2022-08-21 13:05:06

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号