首页> 美国卫生研究院文献>BMC Medical Informatics and Decision Making >Text data extraction for a prospective research-focused data mart: implementation and validation
【2h】

Text data extraction for a prospective research-focused data mart: implementation and validation

机译:文本数据提取用于以研究为重点的前瞻性数据集市:实施和验证

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

BackgroundTranslational research typically requires data abstracted from medical records as well as data collected specifically for research. Unfortunately, many data within electronic health records are represented as text that is not amenable to aggregation for analyses. We present a scalable open source SQL Server Integration Services package, called Regextractor, for including regular expression parsers into a classic extract, transform, and load workflow. We have used Regextractor to abstract discrete data from textual reports from a number of ‘machine generated’ sources. To validate this package, we created a pulmonary function test data mart and analyzed the quality of the data mart versus manual chart review.
机译:背景技术翻译研究通常需要从病历中提取数据以及专门为研究而收集的数据。不幸的是,电子健康记录中的许多数据被表示为不适合汇总分析的文本。我们提供了一个可扩展的开源SQL Server Integration Services程序包,称为Regextractor,用于将正则表达式解析器包含到经典的提取,转换和加载工作流程中。我们已经使用Regextractor从许多“机器生成的”来源的文本报告中提取离散数据。为了验证该软件包,我们创建了一个肺功能测试数据集市,并分析了数据集市与手动图表审查的质量。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号