首页> 中国专利> 文本中多义性单词的标注方法、设备、处理器和存储介质

文本中多义性单词的标注方法、设备、处理器和存储介质

摘要

本发明涉及一种文本中多义性单词的标注方法、设备、处理器和存储介质;所述方法包括输入待处理的原始语料库;训练上下文相关词嵌入模型,获得上下文相关向量;根据上下文相关向量搭建语义向量生成算法,区分每个单词的多个含义,并对原始语料库进行标注;输出标注多义性的伪文档。本发明利用上下文相关词嵌入模型,通过对多义性单词的不同语义进行标注,消除多种语义的歧义,相较于没有考虑单词多义性的文本来说,对后续文本处理,文本分类,主题模型等任务的准确度有较大的提升。

著录项

  • 公开/公告号CN112949319B

    专利类型发明专利

  • 公开/公告日2023.01.06

    原文格式PDF

  • 申请/专利权人 江南大学;

    申请/专利号CN202110270079.X

  • 发明设计人 陆恒杨;黄渊卓;方伟;

    申请日2021.03.12

  • 分类号G06F40/30;G06F40/284;G06N3/04;G06N3/08;

  • 代理机构苏州市中南伟业知识产权代理事务所(普通合伙);

  • 代理人王广浩

  • 地址 214122 江苏省无锡市蠡湖大道1800号

  • 入库时间 2023-01-18 22:38:25

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-01-06

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号