首页> 外文期刊>Molecular BioSystems >PLS/OPLS models in metabolomics: the impact of permutation of dataset rows on the K-fold cross-validation quality parameters
【24h】

PLS/OPLS models in metabolomics: the impact of permutation of dataset rows on the K-fold cross-validation quality parameters

机译:代谢组学中的PLS / OPLS模型:数据集行排列对K折交叉验证质量参数的影响

获取原文
获取原文并翻译 | 示例
       

摘要

Among all the software packages available for discriminant analyses based on projection to latent structures (PLS-DA) or orthogonal projection to latent structures (OPLS-DA), SIMCA (Umetrics, Umea Sweden) is the more widely used in the metabolomics field. SIMCA proposes many parameters or tests to assess the quality of the computed model (the number of significant components, R~2, Q~2, Pcv-anova, and the permutation test). Significance thresholds for these parameters are strongly application-dependent. Concerning the Q~2 parameter, a significance threshold of 0.5 is generally admitted. However, during the last few years, many PLS-DA/OPLS-DA models built using SIMCA have been published with Q~2 values lower than 0.5. The purpose of this opinion note is to point out that, in some circumstances frequently encountered in metabolomics, the values of these parameters strongly depend on the individuals that constitute the validation subsets. As a result of the way in which the software selects members of the calibration and validation subsets, a simple permutation of dataset rows can, in several cases, lead to contradictory conclusions about the significance of the models when a K-fold cross-validation is used. We believe that when Q~2 values lower than 0.5 are obtained, SIMCA users should at least verify that the quality parameters are stable towards permutation of the rows in their dataset.
机译:在可用于基于对潜在结构的投影(PLS-DA)或对潜在结构的正交投影(OPLS-DA)的判别分析的所有软件包中,SIMCA(Umetrics,Umea Sweden)在代谢组学领域中的使用更为广泛。 SIMCA提出了许多参数或测试来评估计算模型的质量(有效成分的数量,R〜2,Q〜2,Pcv-anova和置换测试)。这些参数的重要性阈值高度依赖于应用程序。关于Q〜2参数,显着性阈值一般为0.5。然而,在最近几年中,已经发布了许多使用SIMCA构建的PLS-DA / OPLS-DA模型,其Q〜2值均小于0.5。该意见的目的是指出,在代谢组学中经常遇到的某些情况下,这些参数的值在很大程度上取决于构成验证子集的个体。作为软件选择校准和验证子集成员的方式的结果,在某些情况下,如果进行K折交叉验证,则对数据集行进行简单排列可能得出关于模型重要性的矛盾结论。用过的。我们认为,当获得的Q〜2值小于0.5时,SIMCA用户至少应验证质量参数对于其数据集中的行排列是稳定的。

著录项

  • 来源
    《Molecular BioSystems》 |2015年第1期|13-19|共7页
  • 作者单位

    Universite Paris 13, Sorbonne Paris Cite, Laboratoire Chimie, Structures, Proprietes de Biomateriaux et d'Agents Therapeutiques (CSPBAT), Unite Mixte de Recherche (UMR) 7244, Centre National de Recherche Scientifique (CNRS), Equipe Spectroscopie des Biomolecules et des Milieux Biologiques (SBMB), 74 rue Marcel Cachin, 93037, Bobigny, France;

    Universite d'Evry Val d'Essonne, Unite de Biologie Integrative des Adaptations a l'Exercice (UBIAE), U902, INSERM, Bd Francois Mitterrand, 91025 Evry Cedex, France;

    Service d'Anesthesie et des Reanimations Chirurgicales, Universite Paris 12, Hopital Henri Mondor, Assistance Publique des Hopitaux de Paris (AP-HP), Creteil, France;

    Universite Paris 13, Sorbonne Paris Cite, Laboratoire Chimie, Structures, Proprietes de Biomateriaux et d'Agents Therapeutiques (CSPBAT), Unite Mixte de Recherche (UMR) 7244, Centre National de Recherche Scientifique (CNRS), Equipe Spectroscopie des Biomolecules et des Milieux Biologiques (SBMB), 74 rue Marcel Cachin, 93037, Bobigny, France;

    Universite Paris 13, Sorbonne Paris Cite, Laboratoire Chimie, Structures, Proprietes de Biomateriaux et d'Agents Therapeutiques (CSPBAT), Unite Mixte de Recherche (UMR) 7244, Centre National de Recherche Scientifique (CNRS), Equipe Spectroscopie des Biomolecules et des Milieux Biologiques (SBMB), 74 rue Marcel Cachin, 93037, Bobigny, France;

    Service d'Hepatologie et Universite Paris 13, Hopital Jean Verdier, Assistance Publique des Hopitaux de Paris (AP-HP), 93143 Bondy Cedex, France;

    Laboratoire de Chimie Analytique, AgroParisTech, 16 rue Claude Bernard, 75231 Paris, France;

    Universite Paris 13, Sorbonne Paris Cite, Laboratoire Chimie, Structures, Proprietes de Biomateriaux et d'Agents Therapeutiques (CSPBAT), Unite Mixte de Recherche (UMR) 7244, Centre National de Recherche Scientifique (CNRS), Equipe Spectroscopie des Biomolecules et des Milieux Biologiques (SBMB), 74 rue Marcel Cachin, 93037, Bobigny, France;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

  • 入库时间 2022-08-18 01:07:58

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号