首页> 外文OA文献 >Statistical Methods for the Modelling of Label-Free Shotgun Proteomic Data in Cell Line Biomarker Discovery
【2h】

Statistical Methods for the Modelling of Label-Free Shotgun Proteomic Data in Cell Line Biomarker Discovery

机译:细胞系生物标志物发现中无标签Label弹枪蛋白质组数据建模的统计方法

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

[cat] En la tesi s'ha desenvolupat, dissenyat i implementat una solució per l'anàlisi de dades de proteòmica comparativa en descobriment de biomarcadors. Específicament la solució s'ha optimitzat per l'anàlisi de secretomes de línies cel•lulars tumorals per LC-MS/MS sense marcatge, i quantificant pel nombre d'espectres de pèptids assignats a cada proteïna. Durant el desenvolupament de la metodologia s'ha demostrat la incidència i rellevància dels efectes batch en l'anàlisi comparatiu de pèptits sense marcar per LC-MS/MS. Així com les característiques que identifiquen un potencial biomarcador com a reproductible. Els models s'han desenvolupat amb l'ajut de dades empíriques obtingudes de mostres amb mescles controlades de proteïnes, i de simulacions. La solució informàtica que implementa el model desenvolupat consta de dos paquets R/Bioconductor, amb les respectives interfícies gràfiques que faciliten el seu ús a no experts. El primer paquet, msmsEDA, consta de funcions útils en l'anàlisi exploratòria de dades, i permet avaluar la qualitat del conjunt de dades d'un experiment de LC-MS/MS basat en comptatge d'espectres, així com explorar l'eventual presència de valors extrems, factors de confusió, o d'efectes batch. El segon paquet, msmsTests, encapsula funcions per la inferència en el descobriment de biomarcadors. El model emprat és un GLM que contempla la inclusió de factors per blocs per la correcció d'efectes batch, i incorpora una normalització generalitzada per offsets que permet la comparació de secretoma al nivell d'una cel•lula. Les distribucions implementades són la de Poisson i la binomial negativa, així com l'extensió de la quasiversemblança. En conjut el model desenvolupat i la implementació informàtica que se'n ha fet permet: • Avaluar la qualitat d'un conjunt de dades de LC-MS/MS. • Identificar valors extrems. • Identificar la presència de factors de confusió o d'efectes batch. • El descobriment de biomarcadors emprant la distribució que millor s'ajusti a les dades. • Assegurar un bon nivell de reproductibilitat mercès a un filtre post-test. Els paquets i llur documentació es troben lliurement disponibles a bioconductor.org, i les interfícies gràfiques a github.com.
机译:[eng]在本文中,已经开发,设计和实现了一种在生物标志物发现中比较蛋白质组学数据分析的解决方案。具体而言,该溶液已针对未标记的LC-MS / MS分析肿瘤细胞系分泌组进行了优化,并通过分配给每种蛋白质的肽谱数量进行了定量。在该方法的开发过程中,已证明了通过LC-MS / MS对未标记肽进行比较分析时,批次效应的发生率和相关性。以及将潜在生物标记物识别为可重现的特征。这些模型是借助从具有受控蛋白质混合物的样品中获得的经验数据以及模拟获得的。实现已开发模型的计算机解决方案由两个R / Bioconductor软件包组成,具有各自的图形界面,便于非专家使用。第一个软件包msmsEDA由数据探索性分析中的有用功能组成,可以基于光谱计数来评估LC-MS / MS实验数据集的质量,并探索可能的方法。存在极值,混杂因素或批次效应。第二个包msmsTests通过推断生物标记发现来封装功能。所使用的模型是GLM,该模型考虑了用于批处理效应校正的块因子的纳入,并结合了可通过偏移进行的广义归一化,从而可以在细胞水平比较分泌瘤。实现的分布是泊松分布和负二项式分布,以及拟相似程度。一起开发的模型和已完成的计算机实现可以使它:•评估一组LC-MS / MS数据的质量。 •确定极限值。 •确定混杂因素或批次效应的存在。 •使用最适合数据的分布发现生物标志物。 •借助测试后过滤器,确保良好的可重复性。软件包及其文档可在bioconductor.org上免费获得,图形界面可在github.com上获得。

著录项

  • 作者

    Gregori Font Josep;

  • 作者单位
  • 年度 2014
  • 总页数
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号