首页> 中国专利> 基于歧义实体词的文本处理方法和装置

基于歧义实体词的文本处理方法和装置

摘要

本发明提出一种基于歧义实体词的文本处理方法和装置,其中,方法包括:获取待消歧文本的上下文,以及待消歧文本表征的至少两个候选实体,通过训练的词向量模型生成上下文的语义向量,通过训练的无监督神经网络模型,生成至少两个候选实体的第一实体向量,计算上下文与每一个候选实体之间的相似度,确定出待消歧文本在上下文中所表征的目标实体。通过已学习得到各实体文本语义以及各实体之间关系的无监督神经网络模型,使得生成的候选实体的第一实体向量也包含了候选实体的文本语义以及与各实体之间的关系,使得待消歧文本的实体信息得以完整刻画,再与上下文语义向量计算相似度,确定目标实体,提高了待消歧文本消歧的准确度。

著录项

  • 公开/公告号CN108280061B

    专利类型发明专利

  • 公开/公告日2021-10-26

    原文格式PDF

  • 申请/专利权人 北京百度网讯科技有限公司;

    申请/专利号CN201810044364.8

  • 发明设计人 冯知凡;陆超;朱勇;李莹;

    申请日2018-01-17

  • 分类号G06F40/295(20200101);G06F40/247(20200101);G06N3/08(20060101);G06K9/62(20060101);

  • 代理机构11201 北京清亦华知识产权代理事务所(普通合伙);

  • 代理人宋合成

  • 地址 100085 北京市海淀区上地十街10号百度大厦2层

  • 入库时间 2022-08-23 12:40:43

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号