首页> 外国专利> System and method for analyzing popularity of one or more user defined topics among the big data

System and method for analyzing popularity of one or more user defined topics among the big data

机译:用于分析大数据中一个或多个用户定义主题的受欢迎程度的系统和方法

摘要

A method to analyze popularity of user defined topics by identifying correlations between grams contained in user identified anchor documents and the grams contained in raw documents is provided. The method includes following steps: (a) a user input data that includes (i) user identified topics for user identified subject matter, (ii) user identified topical anchor documents, and (iii) a plurality of user identified raw documents internet source with respective source addresses; (b) the raw document sources is accessed using the source addresses to retrieve and store data in a database; (c) grams and gram document dictionaries together with gram values for each topical anchor document and raw document are identified and stored; and (d) the grams in each of the topical anchor documents against the grams in all the raw documents are analyzed to determine a relative popularity of the topical anchor documents.
机译:提供了一种通过识别用户识别的锚文档中包含的克与原始文档中包含的克之间的相关性来分析用户定义的主题的受欢迎程度的方法。该方法包括以下步骤:(a)用户输入数据,该数据包括(i)用户标识的主题的用户标识的主题,(ii)用户标识的主题锚文档,以及(iii)多个用户标识的原始文档Internet来源各自的源地址; (b)使用源地址访问原始文档源,以检索数据并将其存储在数据库中; (c)识别并存储克和克文档词典以及每个主题锚文档和原始文档的克值; (d)分析每个主题锚文档中的克相对于所有原始文档中的克,以确定主题锚文档的相对流行度。

著录项

  • 公开/公告号US10067964B2

    专利类型

  • 公开/公告日2018-09-04

    原文格式PDF

  • 申请/专利权人 JOHN L. HALLER JR.;

    申请/专利号US201615251543

  • 发明设计人 JOHN L. HALLER JR.;

    申请日2016-08-30

  • 分类号G06F17/30;

  • 国家 US

  • 入库时间 2022-08-21 13:01:54

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号