首页> 美国卫生研究院文献>AMIA Annual Symposium Proceedings >TextHunter – A User Friendly Tool for Extracting Generic Concepts from Free Text in Clinical Research
【2h】

TextHunter – A User Friendly Tool for Extracting Generic Concepts from Free Text in Clinical Research

机译:TextHunter –一种易于使用的工具可从临床研究中的免费文本中提取通用概念

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Observational research using data from electronic health records (EHR) is a rapidly growing area, which promises both increased sample size and data richness - therefore unprecedented study power. However, in many medical domains, large amounts of potentially valuable data are contained within the free text clinical narrative. Manually reviewing free text to obtain desired information is an inefficient use of researcher time and skill. Previous work has demonstrated the feasibility of applying Natural Language Processing (NLP) to extract information. However, in real world research environments, the demand for NLP skills outweighs supply, creating a bottleneck in the secondary exploitation of the EHR. To address this, we present TextHunter, a tool for the creation of training data, construction of concept extraction machine learning models and their application to documents. Using confidence thresholds to ensure high precision (>90%), we achieved recall measurements as high as 99% in real world use cases.
机译:使用电子健康记录(EHR)中的数据进行的观察研究是一个快速增长的领域,它有望增加样本数量和数据丰富性,因此具有空前的研究能力。但是,在许多医学领域,自由文本临床叙述中包含大量潜在有价值的数据。手动查看自由文本以获取所需信息是研究人员时间和技能的低效使用。先前的工作证明了应用自然语言处理(NLP)提取信息的可行性。但是,在现实世界的研究环境中,对NLP技能的需求胜过供应,这在EHR的二次开发中造成了瓶颈。为了解决这个问题,我们介绍了TextHunter,这是一种用于创建训练数据,构建概念提取机器学习模型并将其应用于文档的工具。使用置信度阈值来确保高精度(> 90%),我们在实际使用案例中实现了高达99%的召回率测量。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号