首页> 中国专利> 分词过程中进行前缀索引的方法及装置

分词过程中进行前缀索引的方法及装置

摘要

本发明实施例提供一种分词过程中进行前缀索引的方法及装置,所述方法包括:基于改进的哈希算法SDBMHash对词典数据进行拆分并存储到多个双数组Trie树中;利用所述改进的哈希算法SDBMHash对待检索的词进行哈希计算,并根据哈希计算的结果确定所述待检索的词所在的双数组Trie树;在所述待检索的词所在的双数组Trie树中对所述待检索的词进行前缀索引。本发明实施例在支持把词典拆分多个双数组Trie树的应用场景下,还能保证在分词过程中前缀索引的高效。

著录项

  • 公开/公告号CN109684439B

    专利类型发明专利

  • 公开/公告日2020-10-30

    原文格式PDF

  • 申请/专利权人 语联网(武汉)信息技术有限公司;

    申请/专利号CN201811622746.0

  • 发明设计人 谭峰;

    申请日2018-12-28

  • 分类号G06F16/31(20190101);G06F16/332(20190101);G06F16/36(20190101);

  • 代理机构11002 北京路浩知识产权代理有限公司;

  • 代理人王莹;吴欢燕

  • 地址 430000 湖北省武汉市东湖开发区光谷软件园一期以西、南湖南路以南、光谷软件园六期2幢5层205号

  • 入库时间 2022-08-23 11:19:41

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号