首页> 中国专利> 基于原型记忆的小数据词表示学习方法与系统及相关设备

基于原型记忆的小数据词表示学习方法与系统及相关设备

摘要

本发明涉及自然语言处理技术领域,具体涉及一种基于原型记忆的小数据词表示学习方法与系统及相关设备,目的在于解决传统的分布语义模型为了得到高质量的词表示,要求每个目标词具有大量的上下文样本的问题。本发明的基于原型记忆的小数据词表示学习方法包括:根据通用领域语料库,对键值记忆储存模型进行初始化;根据通用领域语料库学习词表示,并在键值记忆储存模型中存储词的原型表示;根据罕见词语料库,利用键值记忆储存模型,学习罕见词的词表示。本发明中原型表示的构建使得模型不再需要逐个记忆所有过往样本,同时具有更好的泛化能力。在利用大规模语料中完成知识积累后,在小规模语料中给定有限上下文的情况下,快速学习目标词的表示。

著录项

  • 公开/公告号CN110008480B

    专利类型发明专利

  • 公开/公告日2020-12-11

    原文格式PDF

  • 申请/专利权人 中国科学院自动化研究所;

    申请/专利号CN201811479634.4

  • 发明设计人 王少楠;孙静远;宗成庆;

    申请日2018-12-05

  • 分类号G06F40/40(20200101);G06F16/36(20190101);

  • 代理机构11576 北京市恒有知识产权代理事务所(普通合伙);

  • 代理人郭文浩

  • 地址 100190 北京市海淀区中关村东路95号

  • 入库时间 2022-08-23 11:11:49

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号