首页> 中国专利> 一种切分索引分词的方法及系统

一种切分索引分词的方法及系统

摘要

本发明公开了一种切分索引分词的方法,包括以下步骤:读取字符流;识别所述字符流,确定汉字、英文字符或数字以及不可识别字符;将已经确定的汉字、英文字符或数字与预先建立的词典树比较,确定匹配的分词;将英文字符或数字进行ASCII码通用模糊匹配,确定英文字符串或者数字串的分词;将上述匹配的分词和所述英文字符串或者数字串的分词以及不可识别字符,按所述字符流顺序进行排序;按所述排序后的分词和所述英文字符串或者数字串排序的顺序划分所述字符流。本发明还公开切分索引分词的系统。本发明提供一种切分索引分词的方法及系统,能够同时解决分词准确、一定量的冗余词以及单字分词的问题,增强用户体验。

著录项

  • 公开/公告号CN100476800C

    专利类型发明授权

  • 公开/公告日2009-04-08

    原文格式PDF

  • 申请/专利权人 腾讯科技(深圳)有限公司;

    申请/专利号CN200710123051.3

  • 发明设计人 王启明;

    申请日2007-06-22

  • 分类号G06F17/27(20060101);G06F17/30(20060101);

  • 代理机构11227 北京集佳知识产权代理有限公司;

  • 代理人逯长明

  • 地址 518044 广东省深圳市福田区振兴路赛格科技园2栋东410室

  • 入库时间 2022-08-23 09:02:07

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-01-13

    专利权的转移 IPC(主分类):G06F 17/27 登记生效日:20151222 变更前: 变更后: 申请日:20070622

    专利申请权、专利权的转移

  • 2009-04-08

    授权

    授权

  • 2008-01-09

    实质审查的生效

    实质审查的生效

  • 2007-11-14

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号