首页> 中国专利> 从中文自然语言中抽取结构化知识的方法和装置

从中文自然语言中抽取结构化知识的方法和装置

摘要

本申请公开了一种从中文自然语言中抽取结构化知识的方法及装置,该方法包括:从输入文本中抽取候选实体并对候选实体进行打分,基于开放的实体抽取抽取的实体集,在知识库中检索实体集以完成开放实体链接,基于实体集中实体的优先级重新处理输入文本,并采用基于规则的三元组抽取,得到候选关系三元组,利用语义嵌入模型对输入文本和候选关系三元组分别做语义空间的向量嵌入,根据语义还原度筛选候选三元组,并确定关系抽取结果,将关系抽取结果通过融合策略添加到实体集中以融合生成图谱。本发明显著提高了实体和关系抽取的召回率,又能够极大限度的筛选出语义还原度高的知识三元组,提高抽取的精度还可以自动生成特定领域的知识图谱。

著录项

  • 公开/公告号CN113868382A

    专利类型发明专利

  • 公开/公告日2021-12-31

    原文格式PDF

  • 申请/专利权人 北京智谱华章科技有限公司;

    申请/专利号CN202110943375.1

  • 申请日2021-08-17

  • 分类号G06F16/332(20190101);G06F16/36(20190101);G06F40/279(20200101);

  • 代理机构11201 北京清亦华知识产权代理事务所(普通合伙);

  • 代理人张梦瑶

  • 地址 100084 北京市海淀区中关村东路1号院6号楼6层603A

  • 入库时间 2023-06-19 13:29:16

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-11-29

    著录事项变更 IPC(主分类):G06F16/332 专利申请号:2021109433751 变更事项:发明人 变更前:孙梦阳张鹏刘丁枭李涓子唐杰刘德兵仇瑜 变更后:孙梦阳张鹏刘丁枭刘德兵仇瑜

    著录事项变更

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号