首页> 外文学位 >Ontology-guided extraction of structured information from unstructured text: Identifying and capturing complex relationships.
【24h】

Ontology-guided extraction of structured information from unstructured text: Identifying and capturing complex relationships.

机译:从非结构化文本的本体论指导中提取结构化信息:识别和捕获复杂的关系。

获取原文
获取原文并翻译 | 示例

摘要

Many applications call for methods to enable automatic extraction of structured information from unstructured natural language text. Due to the inherent challenges of natural language processing, most of the existing methods for information extraction from text tend to be domain specific. This thesis explores a modular ontology-based approach to information extraction that decouples domain-specific knowledge from the rules used for information extraction. Specifically, the thesis describes: (1) A framework for ontology-driven extraction of a subset of nested complex relationships (e.g., Joe reports that Jim is a reliable employee) from free text. The extracted relationships are semantically represented in the form of RDF (resource description framework) graphs, which can be stored in RDF knowledge bases and queried using query languages for RDF. (2) An open source implementation of SEMANTIXS, a system for ontology-guided extraction and semantic representation of structured information from unstructured text. (3) Results of experiments that offer some evidence of the utility of the proposed ontology- based approach to extract complex relationships from text.
机译:许多应用程序要求使用方法来自动从非结构化自然语言文本中提取结构化信息。由于自然语言处理的固有挑战,从文本中提取信息的大多数现有方法往往是特定于领域的。本文探索了一种基于模块化本体的信息提取方法,该方法将特定领域的知识与信息提取规则分离。具体而言,本文描述了:(1)一种框架驱动的框架,用于从自由文本中提取嵌套的复杂关系的子集(例如,Joe报告Jim是可靠的员工)。提取的关系以RDF(资源描述框架)图的形式在语义上表示,该图可以存储在RDF知识库中,并使用RDF的查询语言进行查询。 (2)SEMANTIXS的开源实现,SEMANTIXS是一个用于从非结构化文本中进行本体指导的结构化信息的提取和语义表示的系统。 (3)实验结果提供了一些建议的基于本体的方法从文本中提取复杂关系的效用的证据。

著录项

  • 作者

    Pandit, Sushain.;

  • 作者单位

    Iowa State University.;

  • 授予单位 Iowa State University.;
  • 学科 Artificial Intelligence.Computer Science.
  • 学位 M.S.
  • 年度 2010
  • 页码 92 p.
  • 总页数 92
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

  • 入库时间 2022-08-17 11:36:46

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号