首页> 中国专利> 一种基于Mean Shift的融合词性和句子信息的词表示方法

一种基于Mean Shift的融合词性和句子信息的词表示方法

摘要

本发明公开了一种基于Mean Shift的融合词性和句子信息的词表示方法,包括步骤:1)对语料进行分词和词性标注;2)使用skim‑gram、CROW方法训练得到字词联合向量;3)通过使用skim‑gram、CROW方法训练直接得到词性向量或使用属于同一词性的所有词向量的平均值作为词性向量;4)用Attention机制和词性向量生成句子向量,进行主分析主成分PCA;5)对上下文矩阵进行Mean Shift聚类,对Top‑K聚类中心进行加权求和后得到上下文向量;6)对字词联合向量、词性向量和上下文向量加权求和得到最终的词向量表示。本发明实现的词表示方法,融合了词性信息和句子信息,利用了已有的词性标注信息和去噪后的上下文向量,不依赖于特定领域和语料,具有较低的成本和较强的实用性。

著录项

  • 公开/公告号CN108763487B

    专利类型发明专利

  • 公开/公告日2021-08-10

    原文格式PDF

  • 申请/专利权人 华南理工大学;

    申请/专利号CN201810534989.2

  • 发明设计人 邓辉舫;赖港明;

    申请日2018-05-30

  • 分类号G06F16/35(20190101);G06F40/30(20200101);G06K9/62(20060101);

  • 代理机构44245 广州市华学知识产权代理有限公司;

  • 代理人冯炳辉

  • 地址 510640 广东省广州市天河区五山路381号

  • 入库时间 2022-08-23 12:17:29

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号