首页> 外国专利> Deep embedding for natural language content based on semantic dependencies

Deep embedding for natural language content based on semantic dependencies

机译:基于语义依赖性对自然语言内容进行深度嵌入

摘要

Mechanisms are provided to perform embedding of content of a natural language document. The mechanisms receive a document data object of an electronic document and analyze a structure of the electronic document to identify one or more structural document elements that have a relationship with the document data object. A dependency data structure is generated, representing the electronic document, where edges define relationships between document elements and at least one edge represents at least one relationship between the one or more structural document elements and the document data object. The mechanisms embed the document data object based on the at least one relationship to thereby represent the document data object as a vector data structure. The mechanisms perform natural language processing on the portion of natural language content based on the vector data structure. The one or more structural document elements are non-local non-contiguous with the document data object.
机译:提供了用于执行自然语言文档内容嵌入的机制。所述机制接收电子文档的文档数据对象,并且分析电子文档的结构以识别与文档数据对象具有关系的一个或多个结构文档元素。产生表示电子文档的依赖关系数据结构,其中边缘定义文档元素之间的关系,并且至少一个边缘表示一个或多个结构文档元素与文档数据对象之间的至少一种关系。该机制基于至少一种关系来嵌入文档数据对象,从而将文档数据对象表示为矢量数据结构。这些机制基于矢量数据结构对自然语言内容的一部分执行自然语言处理。一个或多个结构文档元素与文档数据对象是非本地非连续的。

著录项

  • 公开/公告号US10380259B2

    专利类型

  • 公开/公告日2019-08-13

    原文格式PDF

  • 申请/专利权人 INTERNATIONAL BUSINESS MACHINES CORPORATION;

    申请/专利号US201715601016

  • 发明设计人 TAESUNG LEE;YOUNGJA PARK;

    申请日2017-05-22

  • 分类号G06F17/27;G06N3/04;G06N3/08;G10L15/18;G10L15/183;G10L15/19;

  • 国家 US

  • 入库时间 2022-08-21 12:16:29

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号