首页> 外国专利> Unsupervised detection and categorization of word clusters in text data

Unsupervised detection and categorization of word clusters in text data

机译:文本数据中词簇的无监督检测和分类

摘要

Categorizing data sets obtained from a number of sources includes determining the frequency of appearance of symbols in a first collection of data sets and the frequency of appearance of symbols in a second collection of data sets, determining the most significant symbols for the second collection based on the frequency of appearance in the first collection and the frequency of appearance in the second collection, grouping the most significant symbols into groups according to their appearance in the same data set and ranking the data sets in relation to the symbol groups according to a ranking scheme. Related methods, devices, and/or computer program products are described.
机译:对从多个来源获得的数据集进行分类包括:确定数据集的第一集合中符号出现的频率和数据集的第二集合中符号出现的频率,根据以下信息确定第二集合中最重要的符号:第一个集合中的出现频率和第二个集合中的出现频率,根据最高有效符号在相同数据集中的出现将其分组,并根据排名方案对与符号组相关的数据集进行排名。描述了相关的方法,设备和/或计算机程序产品。

著录项

  • 公开/公告号US9563666B2

    专利类型

  • 公开/公告日2017-02-07

    原文格式PDF

  • 申请/专利权人 KAIROS FUTURE GROUP AB;

    申请/专利号US201214358438

  • 发明设计人 TOMAS LARSSON;MATS LINDGREN;

    申请日2012-11-09

  • 分类号G06F17/30;G06F17;

  • 国家 US

  • 入库时间 2022-08-21 13:41:22

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号