首页> 中国专利> 一种基于图结构的中文新词识别方法

一种基于图结构的中文新词识别方法

摘要

本发明涉及一种基于图结构的中文新词识别方法,其步骤包括:1)根据词之间的邻接关系将文档集抽象成有权有向图;2)遍历所述有权有向图的所有点,基于共现率选出每一个点的备选新词;3)对所述备选新词进行路径拓展,找到共现率始终大于阈值的最大权值路径,从而得到完整的备选新词;4)根据信息熵对所述完整的备选新词进行过滤,得到最终的备选新词集合。本发明首次提出了将文档集抽象为图结构进行新词发现和识别的方法,将新词发现问题转化为在有向有权图上的最大权重路径寻找问题,很好地利用了图的特点,是一种时间复杂度较低、召回率和准确率都较高的新词发现和识别方法。

著录项

  • 公开/公告号CN103970733B

    专利类型发明专利

  • 公开/公告日2017-07-14

    原文格式PDF

  • 申请/专利权人 中国信息安全测评中心;北京大学;

    申请/专利号CN201410143875.7

  • 申请日2014-04-10

  • 分类号G06F17/28(20060101);

  • 代理机构11200 北京君尚知识产权代理事务所(普通合伙);

  • 代理人余长江

  • 地址 100085 北京市海淀区上地西路8号院1号楼

  • 入库时间 2022-08-23 09:58:27

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-03-29

    未缴年费专利权终止 IPC(主分类):G06F 17/28 授权公告日:20170714 终止日期:20180410 申请日:20140410

    专利权的终止

  • 2017-07-14

    授权

    授权

  • 2017-07-14

    授权

    授权

  • 2015-08-19

    著录事项变更 IPC(主分类):G06F17/28 变更前: 变更后: 申请日:20140410

    著录事项变更

  • 2015-08-19

    专利申请权的转移 IPC(主分类):G06F17/28 变更前: 变更后: 登记生效日:20150728 申请日:20140410

    专利申请权、专利权的转移

  • 2015-08-19

    专利申请权的转移 IPC(主分类):G06F 17/28 变更前: 变更后: 登记生效日:20150728 申请日:20140410

    专利申请权、专利权的转移

  • 2015-08-19

    著录事项变更 IPC(主分类):G06F 17/28 变更前: 变更后: 申请日:20140410

    著录事项变更

  • 2015-08-19

    专利申请权的转移 IPC(主分类):G06F 17/28 变更前: 变更后: 登记生效日:20150728 申请日:20140410

    专利申请权、专利权的转移

  • 2015-08-19

    著录事项变更 IPC(主分类):G06F 17/28 变更前: 变更后: 申请日:20140410

    著录事项变更

  • 2014-09-03

    实质审查的生效 IPC(主分类):G06F17/28 申请日:20140410

    实质审查的生效

  • 2014-09-03

    实质审查的生效 IPC(主分类):G06F 17/28 申请日:20140410

    实质审查的生效

  • 2014-09-03

    实质审查的生效 IPC(主分类):G06F 17/28 申请日:20140410

    实质审查的生效

  • 2014-08-06

    公开

    公开

  • 2014-08-06

    公开

    公开

  • 2014-08-06

    公开

    公开

查看全部

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号