首页> 外文会议>Text, speech and dialogue >Detecting and Correcting Errors in an English Tectogrammatical Annotation
【24h】

Detecting and Correcting Errors in an English Tectogrammatical Annotation

机译:检测并更正英文版式注释中的错误

获取原文
获取原文并翻译 | 示例

摘要

We present our first experiments with detecting and correcting errors in a manual annotation of English texts, taken from the Penn Treebank, at the dependency-based tectogrammatical layer, as it is defined in the Prague Dependency Treebank. The main idea is that errors in the annotation usually result in an inconsistency, i. e. the state when a phenomenon is annotated in different ways at several places in a corpus. We describe our algorithm for detecting inconsistencies (it got positive feedback from annotators) and we present some statistics on the manually corrected data and results of a tectogrammatical analyzer which uses these data for its operation. The corrections have improved the data just slightly so far, but we outline some ways to more significant improvement.
机译:我们介绍了我们的第一个实验,该实验用于检测和纠正英文文本的手动注释中的错误,该注释取自Penn树库,位于布拉格依赖树库中定义的基于依存关系的构造层。主要思想是注释中的错误通常会导致不一致,即e。在语料库中多个位置以不同方式注释现象的状态。我们描述了用于检测不一致的算法(它从注释者那里得到了积极的反馈),并且我们提供了一些有关手动校正数据的统计数据,以及使用这些数据进行操作的构造分析仪的结果。到目前为止,这些修正仅对数据有所改善,但我们概述了一些更显着改善的方法。

著录项

  • 来源
    《Text, speech and dialogue》|2009年|32-39|共8页
  • 会议地点 Pilsen(SK);Pilsen(SK)
  • 作者

    Vaclav Klimes;

  • 作者单位

    Charles University in Prague, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics;

  • 会议组织
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类 人工智能理论;
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号