首页> 中国专利> 一种基于频次分布校正的低维词表征学习方法

一种基于频次分布校正的低维词表征学习方法

摘要

本发明公开了一种基于频次分布校正的低维词表征学习方法,对给定的语料,统计出设定窗口内词对的共现频次,通过对共现频次的对数值进行适当的幂次变换,根据语料自适应地优选幂次变换中的幂指数参数值,先将词对共现频次的分布校正为Zipf分布,再通过GloVe模型学习得到低维的词表征向量,实验证明得到的词表征有更高的精度,同时训练速度也更快。通过本发明,可以生成精度更高的低维词表征。

著录项

  • 公开/公告号CN109271622B

    专利类型发明专利

  • 公开/公告日2021-05-14

    原文格式PDF

  • 申请/专利权人 山西大学;

    申请/专利号CN201810897220.7

  • 申请日2018-08-08

  • 分类号G06F40/284(20200101);

  • 代理机构14110 太原晋科知识产权代理事务所(特殊普通合伙);

  • 代理人任林芳

  • 地址 030006 山西省太原市小店区坞城路92号

  • 入库时间 2022-08-23 11:48:05

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号