首页> 中国专利> 分词方法及装置、建立句子向量生成模型方法及装置

分词方法及装置、建立句子向量生成模型方法及装置

摘要

本发明公开了一种分词方法,包括:通过分词技术对待分词句子进行初步分词处理,以得到若干初步分词结果;将若干初步分词结果中的词语转化为词向量;将每一初步分词结果的词向量输入句子向量生成模型,以得到每一初步分词结果的第一句子向量;根据预设算法计算待分词句子的标准句子向量;将与标准句子向量的相似度最高的第一句子向量所对应的初步分词结果确定为待分词句子的最终分词结果;其中,句子向量生成模型为通过句子语料库中的每一句子的标准分词结果的词向量作为输入以及对应的句子的标准句子向量作为输出训练循环神经网络所生成的。本发明得到的分词结果能够有效表达语义,提高了分词的效率与准确率。

著录项

  • 公开/公告号CN107729322B

    专利类型发明专利

  • 公开/公告日2021-01-12

    原文格式PDF

  • 申请/专利权人 广州杰赛科技股份有限公司;

    申请/专利号CN201711080184.7

  • 申请日2017-11-06

  • 分类号G06F40/289(20200101);G06F40/30(20200101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构44202 广州三环专利商标代理有限公司;

  • 代理人梁顺宜;郝传鑫

  • 地址 510310 广东省广州市海珠区新港中路381号31分箱

  • 入库时间 2022-08-23 11:28:40

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号