首页> 中国专利> 一种结合词向量多特征融合的新词发现方法

一种结合词向量多特征融合的新词发现方法

摘要

本发明公开了一种结合词向量多特征融合的新词发现方法,该方法步骤包括:对语料进行特征标注,计算属性对互信息矩阵和自信息矩阵,计算候选特征属性对得分;聚类词向量,找到对应的最近邻类中心向量,并找出该类中心向量对应的词作为词向量特征属性,遍历所有词向量特征属性对,计算词向量特征属性对自信息矩阵和互信息矩阵,计算所有词向量特征属性对得分;对所有候选特征属性对得分配置优化权重系数后求和计算总得分;总得分超过新词阈值时提取候选词对对应得分向量到样本集合;更新权重系数并迭代训练至损失函数收敛获得最终的权重系数;重新计算候选词对总得分,输出超过新词阈值的新词。本发明实现更合理的新词评价方法,更加有效地挖掘潜在的新词。

著录项

  • 公开/公告号CN114298029A

    专利类型发明专利

  • 公开/公告日2022-04-08

    原文格式PDF

  • 申请/专利权人 广州大学;

    申请/专利号CN202111523723.6

  • 申请日2021-12-14

  • 分类号G06F40/289(20200101);G06F40/216(20200101);G06F40/30(20200101);G06K9/62(20220101);G06N5/02(20060101);

  • 代理机构44245 广州市华学知识产权代理有限公司;

  • 代理人郑秋松

  • 地址 510006 广东省广州市番禺区大学城外环西路230号

  • 入库时间 2023-06-19 14:48:21

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-04-08

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号