首页> 中国专利> 联合词性与词序的相关因子训练的word2vec改进方法

联合词性与词序的相关因子训练的word2vec改进方法

摘要

本发明公布了一种联合词性与词序的相关因子训练的word2vec改进方法,提出Structured word2vec on POS模型,包括CWindow‑POS(CWP)模型和Structured Skip gram‑POS(SSGP)模型,两个模型均将词性标注信息与词语顺序作为影响因素联合优化,利用词性关联信息对上下文窗口内词语之间的固有句法关系进行建模;通过词性关联权重对上下文词语序列进行加权计算,再按词语位置顺序进行向量内积计算,使用随机梯度下降(SGD)算法联合学习相关权重和word embedding。本发明将词语按其位置顺序定向嵌入,实现了对词向量和词性相关加权矩阵进行的联合优化;在词语类比任务、词语相似性任务与定性分析都具有高效性。

著录项

  • 公开/公告号CN107526834A

    专利类型发明专利

  • 公开/公告日2017-12-29

    原文格式PDF

  • 申请/专利权人 北京工商大学;

    申请/专利号CN201710791297.1

  • 发明设计人 于重重;曹帅;潘博;张青川;

    申请日2017-09-05

  • 分类号G06F17/30(20060101);G06F17/27(20060101);G06K9/62(20060101);

  • 代理机构11360 北京万象新悦知识产权代理事务所(普通合伙);

  • 代理人黄凤茹

  • 地址 100048 北京市海淀区北京海淀阜成路33号

  • 入库时间 2023-06-19 04:08:06

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-01-26

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20170905

    实质审查的生效

  • 2017-12-29

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号