首页> 外国专利> System and method for Bayesian text classification

System and method for Bayesian text classification

机译:贝叶斯文本分类的系统和方法

摘要

A method for classifying text comprises receiving data containing text and parsing a plurality of tokens out of the text. A plurality of metatokens are generated for each token, wherein the metatokens comprise strings of text and groupings of strings of text. The method further comprises calculating a probability that the data falls into a certain category, using the tokens and metatokens. The probability is compared to a threshold value and the data is classified into the certain category if the probability is greater than the threshold value.
机译:一种用于对文本进行分类的方法,包括:接收包含文本的数据;以及从文本中解析出多个标记。为每个令牌生成多个元令牌,其中,元令牌包括文本字符串和文本字符串分组。该方法还包括使用令牌和元令牌来计算数据落入特定类别的概率。将概率与阈值进行比较,如果概率大于阈值,则将数据分类为特定类别。

著录项

  • 公开/公告号US8103110B2

    专利类型

  • 公开/公告日2012-01-24

    原文格式PDF

  • 申请/专利权人 STEFAN A. BERTEAU;

    申请/专利号US20080121524

  • 发明设计人 STEFAN A. BERTEAU;

    申请日2008-05-15

  • 分类号G06K9/62;

  • 国家 US

  • 入库时间 2022-08-21 17:26:34

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号