首页> 外文会议>43rd Annual Meeting of the Association for Computational Linguistics: Proceeding of the Conference >Weakly Supervised Learning Methods for Improving the Quality ofGene Name Normalization Data
【24h】

Weakly Supervised Learning Methods for Improving the Quality ofGene Name Normalization Data

机译:弱监督学习方法,以提高基因名称标准化数据的质量

获取原文

摘要

A pervasive problem facing many biomedicaltext mining applications is that ofcorrectly associating mentions of entitiesin the literature with corresponding conceptsin a database or ontology. Attemptsto build systems for automating this processhave shown promise as demonstratedby the recent BioCreAtIvE Task 1Bevaluation. A significant obstacle to improvedperformance for this task, however,is a lack of high quality trainingdata. In this work, we explore methods forimproving the quality of (noisy) Task 1Btraining data using variants of weakly supervisedlearning methods. We presentpositive results demonstrating that thesemethods result in an improvement intraining data quality as measured by improvedsystem performance over the samesystem using the originally labeled data.
机译:许多生物医学面临的普遍问题 文本挖掘应用程序是 正确关联实体的提及 在文学中具有相应的概念 在数据库或本体中。尝试次数 建立用于自动化该过程的系统 表现出希望 通过最近的BioCreAtIvE Task 1B 评估。改善的重大障碍 但是,此任务的性能 缺乏高质量的培训 数据。在这项工作中,我们探索了以下方法 提高(嘈杂)任务1B的质量 使用弱监督的变体训练数据 学习方法。我们提出 积极的结果表明,这些 方法带来了改善 通过改进来衡量培训数据的质量 系统性能超过相同 系统使用原始标记的数据。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号