【24h】

MedTag: A Collection of Biomedical Annotations

机译:MedTag:生物医学注释的集合

获取原文

摘要

We present a database of annotatedbiomedical text corpora merged into aportable data structure with uniform conventions.MedTag combines three corpora,MedPost, ABGene and GENETAG,within a common relational database datamodel. The GENETAG corpus has beenmodified to refiect new definitions ofgenes and proteins. The MedPost corpushas been updated to include 1,000additional sentences from the clinicalmedicine domain. All data have been updatedwith original MEDLINE text excerpts,PubMed identifiers, and tokenizationindependence to facilitate data accuracy,consistency and usability.The data are available in fiat files alongwith software to facilitate loading thedata into a relational SQL databasefrom ftp://ftp.ncbi.nlm.nih.gov/pub/lsmith/MedTag/medtag.tar.gz.
机译:我们提供一个带注释的数据库 生物医学文本语料库合并成一个 具有统一约定的可移植数据结构。 MedTag结合了三个语料库, MedPost,ABGene和GENETAG, 在公共关系数据库中的数据 模型。 GENETAG语料库已经 修改以反映新的定义 基因和蛋白质。 MedPost语料库 已更新为包括1,000 临床上的其他句子 医学领域。所有数据已更新 带有原始MEDLINE文字摘录, PubMed标识符和令牌化 独立性以提高数据准确性, 一致性和可用性。 数据在法定文件中以及 带有软件以方便加载 数据到关系SQL数据库中 来自ftp://ftp.ncbi.nlm.nih.gov/pub/lsmith /MedTag/medtag.tar.gz。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号