首页> 中国专利> 一种多义词向量的处理方法、系统、装置及介质

一种多义词向量的处理方法、系统、装置及介质

摘要

本发明公开了一种多义词向量的处理方法、系统、装置及介质。该方法获取包括批量单词的语料库数据;通过主题模型对所述单词进行学习,建立语义空间;获取包括所述多义词的文档,确定所述文档的第一隐语义分布;根据所述语句中各个单词的隐语义和所述第一隐语义分布,确定所述语句的第二隐语义分布;根据所述第二隐语义分布,确定所述多义词的词向量。本申请实施例无需大规模、高质量的人工标注信息即可以无监督地学习到多义词的词向量,且仅用单一的词向量即可同时包含多义词的多个语义,简化了数据结构,改善了自然语言处理中对多语义理解的性能。本发明可广泛应用于自然语言处理技术领域内。

著录项

  • 公开/公告号CN111881689A

    专利类型发明专利

  • 公开/公告日2020-11-03

    原文格式PDF

  • 申请/专利权人 华南师范大学;

    申请/专利号CN202010542528.7

  • 发明设计人 李双印;唐焌景;赵淦森;

    申请日2020-06-15

  • 分类号G06F40/30(20200101);G06N3/08(20060101);G06N7/00(20060101);

  • 代理机构44205 广州嘉权专利商标事务所有限公司;

  • 代理人胡辉

  • 地址 510631 广东省广州市天河区中山大道西55号华南师范大学计算机学院

  • 入库时间 2023-06-19 08:47:24

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号