首页> 外国专利> Methods and apparatus for identifying a count of N-grams occurring in a corpus

Methods and apparatus for identifying a count of N-grams occurring in a corpus

机译:识别语料库中发生的N-gram计数的方法和设备

摘要

Methods, apparatuses, systems, and articles of manufacture for identifying a count of N-grams occurring in a body are disclosed herein. An exemplary method involves identifying a token that often starts a suffix found in the corpus. First suffixes and second suffixes are identified within the corpus, with the first suffixes beginning with the token and the second suffix not beginning with the token. A first count algorithm is performed to identify a first count of N-grams occurring in the first suffixes. A second count algorithm is performed to identify a second count of N-grams occurring in the second suffixes. The second counting algorithm differs from the first counting algorithm.
机译:本文公开了用于识别体内发生的N-克计数的方法,装置,系统和制品。一种示例性方法涉及识别通常开始在语料库中发现的后缀的令牌。在语料库中标识第一个后缀和第二个后缀,第一个后缀以令牌开头,第二个后缀不以令牌开头。执行第一计数算法以识别出现在第一后缀中的N-gram的第一计数。执行第二计数算法以识别在第二后缀中出现的N-gram的第二计数。第二计数算法不同于第一计数算法。

著录项

  • 公开/公告号DE112017006445T5

    专利类型

  • 公开/公告日2019-10-10

    原文格式PDF

  • 申请/专利权人 INTEL CORPORATION;

    申请/专利号DE20171106445T

  • 发明设计人 SHLOMI VAKNIN;

    申请日2017-11-17

  • 分类号G06F16;G06F17/27;

  • 国家 DE

  • 入库时间 2022-08-21 11:44:54

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号