首页> 外文期刊>Language Resources and Evaluation >TEI-friendly annotation scheme for medieval named entities: a case on a Spanish medieval corpus
【24h】

TEI-friendly annotation scheme for medieval named entities: a case on a Spanish medieval corpus

机译:中世纪名为实体的Tei友好的注释计划:西班牙中世纪语料库的案例

获取原文
获取原文并翻译 | 示例
           

摘要

Medieval documents are a rich source of historical data. Performing named-entity recognition (NER) on this genre of texts can provide us with valuable historical evidence. However, traditional NER categories and schemes are usually designed with modern documents in mind (i.e. journalistic text) and the general-domain NER annotation schemes fail to capture the nature of medieval entities. In this paper we explore the challenges of performing named-entity annotation on a corpus of Spanish medieval documents: we discuss the mismatches that arise when applying traditional NER categories to a corpus of Spanish medieval documents and we propose a novel humanist-friendly TEI-compliant annotation scheme and guidelines intended to capture the particular nature of medieval entities.
机译:中世纪文件是丰富的历史数据来源。 在此类型的文本上执行命名实体识别(ner)可以为我们提供有价值的历史证据。 但是,传统的NER类别和方案通常使用现代文件(即新闻文本)设计,并且通用域名注释方案未能捕捉中世纪实体的性质。 在本文中,我们探讨了在西班牙语中世纪文档的语料库上执行命名实体注释的挑战:我们讨论将传统的人类类别应用于西班牙语中世纪文件的语料库时出现的不匹配,并提出了一种新颖的人文友好的标准符合标准 旨在捕捉中世纪实体的特定性质的注释计划和指导方针。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号