首页> 外国专利> METHODS AND APPARATUS TO IDENTIFY A COUNT OF N-GRAMS APPEARING IN A CORPUS

METHODS AND APPARATUS TO IDENTIFY A COUNT OF N-GRAMS APPEARING IN A CORPUS

机译:识别语料库中出现的N字的数量的方法和装置

摘要

Methods, apparatus, systems and articles of manufacture to identify a count of n-grams appearing in a corpus are disclosed herein. An example method includes identifying a token that frequently begins a suffix found in the corpus. First suffixes and second suffixes are identified within the corpus, the first suffixes begin with the token and the second suffixes do not begin with the token. A first counting algorithm is performed to identify a first count of n-grams appearing in the first suffixes. A second counting algorithm is performed to identify a second count of n-grams appearing in the second suffixes. The second counting algorithm is different from the first counting algorithm.
机译:本文公开了识别出现在语料库中的n-克计数的方法,装置,系统和制品。示例方法包括识别经常开始在语料库中找到后缀的令牌。在语料库中标识第一个后缀和第二个后缀,第一个后缀以令牌开头,第二个后缀不以令牌开头。执行第一计数算法以识别出现在第一后缀中的n-gram的第一计数。执行第二计数算法以识别出现在第二后缀中的n-gram的第二计数。第二计数算法不同于第一计数算法。

著录项

  • 公开/公告号WO2018118302A1

    专利类型

  • 公开/公告日2018-06-28

    原文格式PDF

  • 申请/专利权人 INTEL CORPORATION;

    申请/专利号WO2017US62343

  • 发明设计人 VAKNIN SHLOMI;

    申请日2017-11-17

  • 分类号G06F17/30;G06F17/27;

  • 国家 WO

  • 入库时间 2022-08-21 12:43:34

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号