首页> 中国专利> 一种结构域映射蛋白相互作用组的定量分析方法

一种结构域映射蛋白相互作用组的定量分析方法

摘要

本发明属蛋白质组学生物信息学领域,涉及一种结构域映射蛋白相互作用组的定量分析方法。本发明利用“双标签”蛋白质组学技术定量化检测蛋白质相互作用,并通过所鉴定到蛋白质的结构域和定量信息即相互作用程度来分别进行双边聚类和可视化分析,最终得到了靶蛋白相互作用网络中全体蛋白质独特的、多层次的、合理的结构及功能分类,表现出蛋白质通过特定的结构域以及与靶蛋白不同的相互作用程度来响应特定细胞过程的生物学意义。适用于对相互作用蛋白质数据的大规模分析。

著录项

  • 公开/公告号CN101881766A

    专利类型发明专利

  • 公开/公告日2010-11-10

    原文格式PDF

  • 申请/专利权人 复旦大学;

    申请/专利号CN200910050944.9

  • 发明设计人 陈先;邹鹏;罗凯旋;汪洋;

    申请日2009-05-08

  • 分类号G01N33/53;G06N1/00;

  • 代理机构上海正旦专利代理有限公司;

  • 代理人吴桂琴

  • 地址 200433 上海市邯郸路220号

  • 入库时间 2023-12-18 01:13:49

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-06-27

    未缴年费专利权终止 IPC(主分类):G01N33/53 授权公告日:20130529 终止日期:20160508 申请日:20090508

    专利权的终止

  • 2013-05-29

    授权

    授权

  • 2011-02-02

    实质审查的生效 IPC(主分类):G01N33/53 申请日:20090508

    实质审查的生效

  • 2010-11-10

    公开

    公开

说明书

技术领域

本发明属蛋白质组学生物信息学领域,涉及一种结构域映射蛋白相互作用组的定量分析方法。

背景技术

现有技术公开了定量蛋白质组学技术鉴定蛋白相互作用:目前的研究已经不局限于每个单个蛋白或者其的差异变化,而是面向整个蛋白相互作用网络。这些错综复杂的网络以传导各种外界和内在信息,形成功能显著的信号传导通路,调控生理反应,并交叉在一起构成细胞的真实生命图景。而构成这些网络结构主体的各种蛋白质,通过相互联系、相互作用和相互制约的关系中来形成复杂的蛋白质复合体,级联传递各种信息和各种反馈调节的调控网络而发挥其功能和活性作用的,并最终组成更为错综复杂、具有多维时空特性的生命网络体系。通过研究蛋白质相互作用关系,不仅可以发现许多新的相互关系及其生物学功能,更可以对整个细胞调控网络进行全面的认知,这对于发现许多重要的药物作用靶点和疾病诊治靶标有着基于分子水平机理的科学的启示作用。现有技术的定量方法主要包括体外标化学反应记和体内生命代谢标记。

结构域与蛋白质相互作用的关系:结构域是蛋白质序列中具有进化保守性的一段氨基酸序列,是蛋白质分子相互作用的结构基础,同时也是细胞整个信号调控网络中的最小功能单位。结构域信息对于预测和分析鉴定蛋白质间相互作用网络具有重要价值。近年来已出现多种基于结构域信息的相互作用预测方法,从已有数据库中提炼出不同结构域相互作用的概率,再用生物信息学方法进行未知数据的预测,为实验提供可能性的前提。另外,结构域组合间相互作用是蛋白质相互作用中的基本单元的假设,暗示具有相同或者相似结构域的不同蛋白可能通过协同的或者拮抗的方式与某一目标蛋白相互作用来传导信号、反馈调节、行使特定的生物学功能。据报道,Jing使用基于结构域的聚类方法来分析14-3-3蛋白的相互作用关系,结果发现了具有某一特定功能结构域的蛋白簇群通过与靶蛋白构成相互作用组来发挥其在细胞骨架与细胞形态上的特定功能(Current Biology,14,1436-1450)。

聚类分析方法:聚类分析属于无监督学习的范畴,常用于目标观测对象的分类。就是在没有先验知识的情况下,基于“物以类聚”的观点,利用表征观测对象的一组变量对目标按照它们在性质上的亲疏、相似程度进行分类。基本思想是在多维模式空间中,任何一个子集内部样本之间的相似性即同类内相似性大于不同子集样本之间的相似性,即类于类之间的相似性。分层聚类分析(hierarchical clustering analysis,又称系统聚类分析),是把模式样本聚合成一系列聚合类的分层结构,所得到的系统结构可由一个树形图来表示。聚类结果使用树形图(Dendrogram)和灰度梯度图相结合进行可视化表示。

发明内容:

本发明的目的是提供一种结构域映射蛋白相互作用组的定量分析方法。

具体而言,本发明利用“双标签”蛋白质组学技术定量化检测蛋白质相互作用,并通过所鉴定到蛋白质的结构域和定量信息即相互作用程度来分别进行双边聚类和可视化分析,最终得到了靶蛋白相互作用网络中全体蛋白质独特的、多层次的、合理的结构及功能分类,表现出蛋白质通过特定的结构域以及与靶蛋白不同的相互作用程度来响应特定细胞过程的生物学意义。

本发明结合蛋白质的结构域特征和对应的相互作用定量信息分别对所鉴定到的蛋白质进行双边聚类和可视化分析,得到对相互作用网络中蛋白质独特的、多层次的、合理的结构及功能分类,以进一步分析具有某一特定结构和功能蛋白质群体在相互作用网络中对于特定生物过程的响应情况。包括下述步骤:

步骤1:采用“双标签”(表位标签和稳定同位素标记氨基酸标签)定量蛋白质组学技术对相互作用蛋白(蛋白复合物)进行定性鉴定和定量分析,得到与靶蛋白相互作用蛋白的名称和对应的结合程度即定量数据;

其中的表位标签为Flag;稳定同位素标记氨基酸标签为氘代亮氨酸d3-Leu;

步骤2:从蛋白质结构域数据库SMART(Simple Modular Architecture Research Tool)和Pfam(Protein Family Database)中获得步骤1所鉴定的所有相互作用蛋白的功能结构域信息;

步骤3:将步骤2的所有结构域名称混合并按字母顺序排列作为列,将所有鉴定到的蛋白名称作为行。用步骤一中得到的每个蛋白质的定量数据来表示相应各个蛋白所有结构域的定量数值,用零代表不存在的结构域,最后生成蛋白质×结构域(M×N)的数据矩阵;

步骤4:使用蛋白结构域的相关系数(Correlation Coefficient)作为样本相似性测度,采用最小距离法(Single linkage)作为类间相似度依据,对蛋白及其结构域进行双边聚类分析,采用树形图(Dendrogram)来反映不同蛋白和不同结构域的系统聚类结构关系。

步骤5:采用灰度梯度图来可视化的展示相互作用蛋白的聚类模式,用不同颜色的小方块标记来表示蛋白结合程度的定量信息,其中每个小方块表示一个数据点的定量信息,其中所述的灰度梯度图可视化蛋白相互作用的结合程度,结合越多,颜色越浅。

本发明方法结合定量蛋白质组学技术和生物信息学的数据挖掘方法,利用蛋白质结构域的特征数据,对相互作用网络中的蛋白进行基于结构域的聚类分析,并结合蛋白相互作用的定量信息对聚类数据进行定量差异可视化的研究,通过实验,结果显示,具有下述优点:

提出一种独特的、多层次的、合理的蛋白质结构及功能分类方法,体现了一种新颖的、多层次的、具有统计学意义和生物学意义的对蛋白质相互作用蛋白的分析策略,对于理解H2AX的多功能性,以及以其为中心的蛋白质相互作用网络应答刺激的多层次性和多能性有着很好的提示作用。本发明方法适用于对相互作用蛋白质数据的大规模分析。

为了便于理解,以下将通过具体的附图和实施例对本发明的进行详细地描述。需要特别指出的是,具体实例和附图仅是为了说明,显然本领域的普通技术人员可以根据本文说明,在本发明的范围内对本发明做出各种各样的修正和改变,这些修正和改变也纳入本发明的范围内。

附图说明:

图1为结构域映射蛋白相互作用组定量分析的全图,

其中,横轴表示所有的蛋白质名称,纵轴表示所有的结构域,灰色盒表示对应蛋白与靶蛋白相互作用的程度即定量数值,黑色表示无对应的结构域。

图2为图1中A区域的放大图。

图3为图1中B区域的放大图。

具体实施方式:

实施例1

1、在博来霉素诱导细胞DNA损伤的条件下,使用“双标签”定量蛋白质组学技术共鉴定到了89种与靶蛋白H2AX相互作用的蛋白,将这些鉴定到的蛋白在SMART(Simple Modular Architecture Research Tool)和Pfam(Protein Family Database)结构域数据库中搜索,得到对应的结构域注释,即相应的SMART ID和Pfam ID的结构域列表;

2、将步骤1得到的所有结构域的SMART ID和Pfam ID共269个混合并按字母顺序排列作为列,将所有蛋白编号(GeneSymbol)作为行,用表示与H2AX相互作用的结合程度的定量信息来表示相应各个蛋白所有结构域对应的定量数值,用零代表不存在的结构域,生成数据矩阵;

3、使用蛋白功能结构域的相关系数(Correlation Coefficient)作为样本相似性测度,采用最小距离法(Single linkage)作为类间相似度依据,对蛋白和功能结构域进行双边聚类分析,其中,

相关系数的相似度计算公式为:

drs=1-(xr-xr)(xs-xs)[(xr-xr)(xr-xr)]12[(xs-xs)(xs-xs)]12

其中,xr=1nΣjxrj,xs=1nΣjxsj;

最小距离法:计算不同类的两个最近点之间的相似度作为两类间的相似度,公式为:

d(r,s)=min(dist(xri,xsj)),i∈(i,...,nr),j∈(1,...,ns);

双边聚类算法通过下述步骤:

(1)计算每类间的相似度,形成相似度矩阵;

(2)在相似度矩阵中寻找最相似的元素,合并行列对应的聚合类;

(3)重新计算新的聚合类之间的相似度,形成新的相似度矩阵;

(4)返回第2步,直至所有模式样本被聚合为一类,或聚合到规定的类别数,或所有类别间距离均大于给定的相似度阈值;

(5)使用树形图(Dendrogram)反映蛋白功能结构域的系统聚类结构关系。

4、使用灰度梯度图进行可视化的展示相互作用蛋白的聚类模式,其中,使用具有渐进性颜色差异的小方块标记表示蛋白结合程度的定量信息,每个小方块的灰度值表示一个蛋白与H2AX相互作用定量的强度信息。

本发明方法使用结构域映射蛋白相互作用组的定量分析方法对博来霉素诱导条件下H2AX相互作用蛋白进行了综合分析,实验结果显示:获得了一些结构聚类显著的蛋白质群体(如图1)。这些蛋白质类群具有相似的结构域来发挥相似的功能,参与相近的生物过程。而蛋白质类群内相似的定量信息以及蛋白质类群之间不同的定量信息则反应了不同功能蛋白质在行使功能时所需要参与的数量,以及不同功能在应答细胞反应所扮演的角色,提示不同蛋白质类群因为不同功能而在细胞应答过程中的主辅和上下游的关系。由于信号传导的级联性,往往上游的关键信号分子的蛋白相互作用变化较小,而下游的效应分子变化巨大。有效关键功能的蛋白只需要轻微的改变相互作用程度就能够应对刺激而辅助性的蛋白需要急剧的变化来接受信号配合应答。故相互作用的定量信息能够很好的解释在信号调控网络中不同功能蛋白是通过不能程度的结合改变来构成一个多层次的调控网络来适应新的环境,应答外界刺激,减小自身的副作用。

本发明方法实验结果还显示,有一蛋白质聚类具有BRCT和FHA结构域的特征(如图2)。该结构域被证明参与DNA损伤过程中的相互作用,并且具有与磷酸化肽相互结合的功能。具有这个结构域的蛋白,包括MDC1,PARP1,NBN等都是DNA损伤应答过程中H2AX信号传递的重要效应分子。而这类蛋白质在应答DNA损伤时与H2AX相互作用的强度变化是比较微弱的,这也反映了这些蛋白质处于损伤信号传导通路的上游位置,扮演主要的信号传递者的角色。

本发明方法实验结果还显示,含有WD-40结构域的蛋白在聚类分析中出现了富集(如图3),提示WD40结构域可能在DNA损伤修复过程中扮演非常重要的角色。这一结构域是进化上十分保守的结构,有着广泛的分子功能,在许多细胞信号传导方面都有着不可替代的作用。值得注意的是该一类蛋白是所有数据中定量信息变化最显著的群体,表明这一蛋白类群在DNA损伤应答中的辅助角色或者是充当信号下游的分子。而具有这些结构的蛋白质都是通过与H2AX相互作用,参与到H2AX相互作用网络中发挥各种的生物学功能来应答外界的刺激。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号