首页> 外文会议>Workshop on Linked Data in Linguistics >Annohub - Annotation Metadata for Linked Data Applications
【24h】

Annohub - Annotation Metadata for Linked Data Applications

机译:Annohub-链接数据应用程序的注释元数据

获取原文

摘要

We introduce a new dataset for the Linguistic Linked Open Data (LLOD) cloud that will provide metadata about annotation and language information harvested from annotated language resources like corpora freely available on the internet. To our knowledge annotation metadata is not provided by any metadata provider, e.g. linghub. datahub or CLARIN so far. On the other hand, language metadata that is found on such portals is rarely provided in machine-readable form, especially as Linked Data. In this paper, we describe the harvesting process, content and structure of the new dataset and its application in the Lin|gu|is|tik portal, a research platform for linguists. Aside from that, we introduce tools for the conversion of XML encoded language resources to the CoNLL format. The generated RDF data as well as the XML-converter application are made public under an open license.
机译:我们为语言链接开放数据(LLOD)云引入了一个新的数据集,该数据集将提供有关从注释语言资源(如可从Internet免费获得的语料库)中获取的注释和语言信息的元数据。据我们所知,任何元数据提供者都不会提供注释元数据,例如linghub。到目前为止,还是datahub或CLARIN。另一方面,在此类门户网站上找到的语言元数据很少以机器可读的形式提供,尤其是作为链接数据。在本文中,我们描述了新数据集的收集过程,内容和结构及其在Lin | gu | tik门户(语言学家的研究平台)中的应用。除此之外,我们还介绍了用于将XML编码的语言资源转换为CoNLL格式的工具。生成的RDF数据以及XML转换器应用程序在开放许可下公开。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号