【24h】

Corpus design for biomedical natural language processing

机译:生物医学自然语言处理的语料库设计

获取原文

摘要

This paper classifies six publicly availablebiomedical corpora according to variouscorpus design features and characteristics.We then present usage data forthe six corpora. We show that corporathat are carefully annotated with respectto structural and linguistic characteristicsand that are distributed in standard formatsare more widely used than corporathat are not. These findings have implicationsfor the design of the next generationof biomedical corpora.
机译:本文对六个公开可用的类别进行了分类 根据各种生物医学语料库 语料库的设计特点和特征。 然后,我们提供以下用途的数据 六个语料库。我们显示该语料库 尊重地仔细注释的 结构和语言特征 并以标准格式分发 比语料库更广泛地使用 那不是。这些发现有影响 用于下一代的设计 生物医学语料库。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号