首页> 外国专利> SYSTEMS AND METHODS FOR IDENTIFYING LATENT THEMES IN TEXTUAL DATA

SYSTEMS AND METHODS FOR IDENTIFYING LATENT THEMES IN TEXTUAL DATA

机译:用于在文本数据中识别潜在主题的系统和方法

摘要

A computer-implemented method for identifying latent themes in textual data may include receiving a plurality of documents, preprocessing document text for each document among the plurality of documents, calculating a similarity of each pair of documents among the plurality of preprocessed documents, determining one or more document clusters among the plurality of preprocessed documents based on the calculated similarity of each pair of documents among the plurality of preprocessed documents and extracting one or more topics in each document cluster among the determined one or more document clusters
机译:用于识别文本数据中的潜在主题的计算机实现的方法可以包括接收多个文档,用于多个文档中的每个文档的预处理文档文本,计算多个预处理文档中的每对文档的相似性,确定一个或多个预处理文档中的更多文档群集基于多个预处理文档中的每对文档的计算相似性,并在所确定的一个或多个文档群集中提取每个文档集群中的一个或多个主题

著录项

  • 公开/公告号US2021141822A1

    专利类型

  • 公开/公告日2021-05-13

    原文格式PDF

  • 申请/专利权人 MICROSTRATEGY INCORPORATED;

    申请/专利号US202017084581

  • 发明设计人 JERICHO MCLEOD;

    申请日2020-10-29

  • 分类号G06F16/35;G06F16/93;

  • 国家 US

  • 入库时间 2022-08-24 18:40:25

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号