首页> 中国专利> 一种基于高斯分布的词向量生成方法

一种基于高斯分布的词向量生成方法

摘要

本发明公开了一种基于高斯分布的词向量生成方法,首先对语料库进行预处理;其次使用标点符号对语料库划分上下文;然后结合局部和全局信息推断词义,确定词与词义的映射关系;最后通过优化目标函数获得词向量。本发明技术方案的创新点和有益效果在于:1、基于高斯分布来表示词,避免传统词向量的点估计特性,能为词向量带来概率质量,词义蕴含、包含关系等更为丰富的信息。2、使用多个高斯分布来表示词,能够应对自然语言中一词多义的语言特性。3、基于Hellinger距离定义高斯分布之间的相似性,将参数更新和词义判别结合起来,能够自适应地推断词义的数量,解决了现有技术模型的假定词义数量固定的问题。

著录项

  • 公开/公告号CN108733647B

    专利类型发明专利

  • 公开/公告日2022-03-25

    原文格式PDF

  • 申请/专利权人 中山大学;

    申请/专利号CN201810331000.8

  • 发明设计人 沈鸿;曹渝;

    申请日2018-04-13

  • 分类号G06F40/30(20200101);G06K9/62(20220101);

  • 代理机构44329 广东广信君达律师事务所;

  • 代理人杨晓松

  • 地址 510275 广东省广州市新港西路135号

  • 入库时间 2022-08-23 13:20:26

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号