首页> 中国专利> 一种基于图嵌入的新词发现方法、系统、设备及介质

一种基于图嵌入的新词发现方法、系统、设备及介质

摘要

本发明涉及一种基于图嵌入的新词发现方法、系统、设备及介质,包括:使用滑动窗口切取待计算语料的N‑GRAM字符串,计算各字符串的统计量,根据所述统计量为各字符串打分,选取得分满足要求的字符串写入新词候选集;对所述待计算语料进行切词,基于切词结果构建图网络;基于图注意力网络对所述图网络进行计算,得到所述待计算语料的词语的图嵌入;基于通用词典中包含词语的图嵌入对所述新词候选集中包含词语的图嵌入进行筛选,将筛选得到的图嵌入对应的词语作为候选新词。本发明基于图嵌入技术,在新词发现过程中能够有效过滤低质量的候选新词,从而获取更高质量、更可靠的通用新词或领域新词。

著录项

  • 公开/公告号CN112232077B

    专利类型发明专利

  • 公开/公告日2021-10-29

    原文格式PDF

  • 申请/专利权人 和美(深圳)信息技术股份有限公司;

    申请/专利号CN202011060498.2

  • 发明设计人 莫永卓;赵顺峰;练睿;肖杰;

    申请日2020-09-30

  • 分类号G06F40/289(20200101);G06F40/284(20200101);G06F40/242(20200101);G06F40/216(20200101);G06F16/951(20190101);

  • 代理机构11579 北京锺维联合知识产权代理有限公司;

  • 代理人安娜

  • 地址 518040 广东省深圳市福田区沙头街道泰然工贸园苍松大厦1301室

  • 入库时间 2022-08-23 12:41:08

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号