首页> 中国专利> 一种中文文本分词的方法、装置、分词设备及存储介质

一种中文文本分词的方法、装置、分词设备及存储介质

摘要

本发明实施例公开了一种中文文本分词的方法、装置、分词设备及存储介质,所述方法包括:获取待切分文本;根据预设字串最大长度、预设模型以及预设词典为所述待切分文本确定最优切分路径;其中,所述最优切分路径为以预设切分方式切分所述待切分文本,得到的所有字串的成词概率乘积数值最高的切分路径;通过所述最优切分路径对所述待切分文本进行切分,作为所述待切分文本的分词结果,实现在保证分词精度的前提下,降低算法的复杂度,提高算法分词的速度和效率。

著录项

  • 公开/公告号CN108197116B

    专利类型发明专利

  • 公开/公告日2021-05-28

    原文格式PDF

  • 申请/专利权人 天闻数媒科技(北京)有限公司;

    申请/专利号CN201810094475.X

  • 发明设计人 张忠辉;李堪兵;

    申请日2018-01-31

  • 分类号G06F40/216(20200101);G06F40/289(20200101);

  • 代理机构11332 北京品源专利代理有限公司;

  • 代理人孟金喆

  • 地址 100088 北京市西城区德胜门外大街83号德胜国际中心B座5层

  • 入库时间 2022-08-23 11:52:09

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号