首页> 美国卫生研究院文献>other >Ontology-Guided Feature Engineering for Clinical Text Classification
【2h】

Ontology-Guided Feature Engineering for Clinical Text Classification

机译:临床文本分类的本体论引导特征工程

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。
获取外文期刊封面目录资料

摘要

In this study we present novel feature engineering techniques that leverage the biomedical domain knowledge encoded in the Unified Medical Language System (UMLS) to improve machine-learning based clinical text classification. Critical steps in clinical text classification include identification of features and passages relevant to the classification task, and representation of clinical text to enable discrimination between documents of different classes. We developed novel information-theoretic techniques that utilize the taxonomical structure of the Unified Medical Language System (UMLS) to improve feature ranking, and we developed a semantic similarity measure that projects clinical text into a feature space that improves classification. We evaluated these methods on the 2008 Integrating Informatics with Biology and the Bedside (I2B2) obesity challenge. The methods we developed improve upon the results of this challenge’s top machine-learning based system, and may improve the performance of other machine-learning based clinical text classification systems. We have released all tools developed as part of this study as open source, available at
机译:在这项研究中,我们提出了新颖的特征工程技术,利用统一医疗语言系统(UMLS)编码的生物医学域知识来改善基于机器学习的临床文本分类。临床文本分类中的关键步骤包括识别与分类任务相关的特征和段落,以及临床文本的表示,以实现不同类别的文件之间的歧视。我们开发了利用统一医疗语言系统(UMLS)的分类学结构来改善特征排名的新型信息 - 理论技术,并开发了一个语义相似度措施,将临床文本投入到改善分类的特征空间中。我们在2008年将这些方法与生物学和床头(I2B2)肥胖挑战进行了评估了2008年集成信息学。我们制定了对该挑战的最高机器学习系统的结果的提高,并可以提高基于机器学习的临床文本分类系统的性能。我们已发布作为本研究的一部分开发的所有工具,如开源,可用

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号