首页> 中国专利> 一种词典生成方法、新词发现方法、装置及电子设备

一种词典生成方法、新词发现方法、装置及电子设备

摘要

本申请涉及一种词典生成方法、新词发现方法、装置及电子设备。方法包括:对文本语料进行分词处理,得到候选分词集,候选分词集的分词对应有以出现频率为初始值的分词分值;基于候选分词集合对文本语料的语句进行分词划分;多轮迭代执行:基于候选分词集中分词的分词分值,确定文本语料中的语句的分词划分结果的置信值;基于包含目标分词的分词划分结果的置信值总和,更新候选分词集中目标分词的分词分值;基于多轮迭代过程中每个语句置信值最高的分词划分结果,或者基于最后一轮迭代过程中每个语句置信值最高的分词划分结果,构建目标词典。

著录项

  • 公开/公告号CN109614499B

    专利类型发明专利

  • 公开/公告日2023.02.17

    原文格式PDF

  • 申请/专利权人 创新先进技术有限公司;

    申请/专利号CN201811401640.8

  • 发明设计人 杨明晖;

    申请日2018.11.22

  • 分类号G06F40/242(2020.01);G06F40/284(2020.01);G06F40/216(2020.01);

  • 代理机构北京国昊天诚知识产权代理有限公司 11315;北京国昊天诚知识产权代理有限公司 11315;

  • 代理人许振新;朱文杰

  • 地址 英属开曼群岛大开曼岛乔治镇医院路27号开曼企业中心

  • 入库时间 2023-03-15 00:58:13

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号