首页> 外文会议>Annual German Conference on Artificial Intelligence >iDocument: Using Ontologies for Extracting and Annotating Information from Unstructured Text
【24h】

iDocument: Using Ontologies for Extracting and Annotating Information from Unstructured Text

机译:idocument:使用本体学习从非结构化文本中提取和注释信息

获取原文

摘要

Due to the huge amount of text data in the WWW, annotating unstructured text with semantic markup is a crucial topic in Semantic Web research. This work formally analyzes the incorporation of domain ontologies into information extraction tasks in iDocument. Ontology-based information extraction exploits domain ontologies with formalized and structured domain knowledge for extracting domain-relevant information from un-annotated and unstructured text. iDocument provides a pipeline architecture, an extraction template interface and the ability of exchanging domain ontologies for performing information extraction tasks. This work outlines iDocument's ontology-based architecture, the use of SPARQL queries as extraction templates and an evaluation of iDocument in an automatic document annotation scenario.
机译:由于WWW中的大量文本数据,具有语义标记的注释非结构化文本是语义网络研究中的一个重要主题。这项工作正式分析了域名本体的结合到idocument中的信息提取任务中。基于Intology的信息提取利用域本体,并具有正式和结构化域知识,用于从未注释和非结构化文本中提取域相关信息。 idocument提供了流水线架构,提取模板接口和交换域本体的能力,以便执行信息提取任务。这项工作概述了idocument的基于本体的架构,使用sparql查询作为提取模板以及在自动文档注释方案中的idocument的评估。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号