首页> 美国卫生研究院文献>BMC Bioinformatics >A decision theory paradigm for evaluating identifier mapping and filtering methods using data integration
【2h】

A decision theory paradigm for evaluating identifier mapping and filtering methods using data integration

机译:使用数据集成评估标识符映射和过滤方法的决策理论范式

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

BackgroundIn bioinformatics, we pre-process raw data into a format ready for answering medical and biological questions. A key step in processing is labeling the measured features with the identities of the molecules purportedly assayed: “>molecular identification” (>MI). Biological meaning comes from identifying these molecular measurements correctly with actual molecular species. But MI can be incorrect. >Identifier filtering (>IDF) selects features with more trusted MI, leaving a smaller, but more correct dataset. >Identifier mapping (>IDM) is needed when an analyst is combining two high-throughput (HT) measurement platforms on the same samples. IDM produces ID pairs, one ID from each platform, where the mapping declares that the two analytes are associated through a causal path, direct or indirect (example: pairing an ID for an mRNA species with an ID for a protein species that is its putative translation). Many competing solutions for IDF and IDM exist. Analysts need a rigorous method for evaluating and comparing all these choices.
机译:背景技术在生物信息学中,我们将原始数据预处理为可用于回答医学和生物学问题的格式。处理过程中的关键步骤是用据称被测分子的身份标记被测特征:“ >分子鉴定”(> MI )。生物学意义来自正确识别具有实际分子种类的这些分子测量值。但是MI可能不正确。 >标识符过滤(> IDF )选择具有更受信任的MI的要素,从而保留较小但更正确的数据集。当分析师将两个高通量(HT)测量平台结合在同一样品上时,需要>标识符映射(> IDM )。 IDM生成ID对,每个平台有一个ID,在该映射中声明两种分析物是通过直接或间接的因果路径关联的(例如:将mRNA种类的ID与假定的蛋白质种类的ID配对翻译)。存在许多针对IDF和IDM的竞争解决方案。分析师需要一种严格的方法来评估和比较所有这些选择。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号