首页> 中国专利> 相互作用力变化预测装置和相互作用力变化预测方法

相互作用力变化预测装置和相互作用力变化预测方法

摘要

相互作用力变化预测装置(100)具备:结合3残基组数据作成部(211),制作3残基组的结合3残基组数据,该3残基组表示1对氨基酸残基对、与氨基酸残基对中的一个氨基酸残基相邻的1个氨基酸残基;突变后3残基组数据作成部(212),制作突变后的3残基组的突变后3残基组数据;相互作用分值算出部(213),参照3残基组表(151),计算出由结合3残基组数据所示的3残基组的结合相互作用分值和由突变后3残基组数据所示的3残基组的突变后相互作用分值;相互作用力变化预测值算出部(214),计算出结合相互作用分值和突变后相互作用分值的差分。

著录项

  • 公开/公告号CN102272762A

    专利类型发明专利

  • 公开/公告日2011-12-07

    原文格式PDF

  • 申请/专利权人 松下电器产业株式会社;

    申请/专利号CN201080003898.8

  • 发明设计人 榛叶教子;

    申请日2010-08-16

  • 分类号G06F19/10(20110101);

  • 代理机构11322 北京尚诚知识产权代理有限公司;

  • 代理人龙淳

  • 地址 日本大阪府

  • 入库时间 2023-12-18 04:00:10

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-11-25

    授权

    授权

  • 2015-10-28

    专利申请权的转移 IPC(主分类):G06F19/10 登记生效日:20150928 变更前: 变更后: 申请日:20100816

    专利申请权、专利权的转移

  • 2013-02-13

    实质审查的生效 IPC(主分类):G06F19/10 申请日:20100816

    实质审查的生效

  • 2011-12-07

    公开

    公开

说明书

技术领域

本发明涉及相互作用力预测装置,其使用生物信息学中的数据处 理,预测发生相互作用的蛋白质间的相互作用力的变化。

背景技术

目前,作为蛋白质间相互作用的预测方法,提出了各种方法。

例如,在表示2个蛋白质发生相互作用时的三维结构状态的复合 体立体结构已知的情况下,为了预测在以该复合体立体结构作为基础 对蛋白质施加突变时蛋白质间的相互作用如何变化,有使用基于分子 力学等物理化学的模拟方法,预测替换残基后的复合体立体结构和结 合自由能变化的方法(例如,参照非专利文献1)。

另外,在仅已知2个蛋白质的一维结构信息时,有下述方法:从 对于由规定长度的氨基酸序列的组合构成的序列对进行了相互作用可 能性的评分后的带有分值的序列对的集合中,检索所给出的1对蛋白 质的氨基酸序列对,预测相互作用(例如,参照专利文献1、非专利文 献2和非专利文献3)。图19是表示专利文献1记载的现有的蛋白质间 相互作用预测装置的功能性构成的框图。在图19中,蛋白质相互作用 预测装置1具备:具有序列对生成部10和序列对评价部20的带有分 值的序列对生成部30、相互作用预测部40、相互作用候补筛选部50 和突变设计部60。带有分值的序列对生成部30生成带有分值的序列对 集合,该带有分值的序列对集合是带有关于蛋白质的氨基酸序列间的 相互作用的分值的序列对的集合。相互作用预测部40,使用生成的带 有分值的序列对集合,预测2个蛋白质间的相互作用。该带有分值的 序列对集合由序列对和分值构成,上述序列对由构成蛋白质的氨基酸 序列的一部分的规定长度的部分氨基酸序列的组合构成。

现有技术文献

专利文献

专利文献1:日本专利第4320145号公报

非专利文献

非专利文献1:Shaun M Lippow et al.,“Computational Design of  antibody-affinity improvement beyond in vivo maturation”,Nature  biotechnology volume 25,number10,2007

非专利文献2:清水谦多郎等,“高精度のドツキング機能を有するタ ンパク質間相互作用予測システムの開発”,文部科学省“ゲノム特定 領域”年度报告书领域1生命システム情報,2007年

非专利文献3:清水谦多郎等,“タパク質相互作用のネツトワ一ク 予測から原子レベルの結合予測までの統合的研究”,文部科学省“ゲ ノム特定領域”年度报告书领域1生命システム情報,2008年

发明内容

发明所要解决的课题

然而,在上述非专利文献1所示的基于物理化学的模拟中,需要 用于算出突变后的复合体立体结构预测和结合自由能变化的力学计算 环境等,存在计算资源大规模化的问题。另外,由于这样的处理的计 算负荷高,存在为了网罗各种突变类型进行模拟而需要长时间的问题。

另外,在上述专利文献1所示的蛋白质相互作用预测装置1中, 使用包括由规定长度的部分氨基酸序列的组合构成的序列对和分值的 带有分值的序列对集合作为用于预测的检索信息,推测2个蛋白质间 的相互作用。在该蛋白质相互作用预测装置1中,在非专利文献2和 非专利文献3中设想对显示了最好结果的3个氨基酸组作为规定长度 的部分氨基酸序列进行处理。即使在这种情况下,带有分值的序列对 集合的数据数也达到20(氨基酸的种类数)的6次方,即3200万。因 此,需要用于进行大量的数据生成和检索的内存,存在耗费计算负荷 的问题。

本发明是为了解决上述问题而完成的,其目的在于提供一种相互 作用力变化预测方法,即使在较少的计算资源下,也能够使用已知的 复合体立体结构,在发生相互作用的2个蛋白质内的1个蛋白质的相 互作用部位上施加突变的情况下预测其相互作用力如何变化。

用于解决课题的方法

为了达到上述目的,本发明一个方面提供一种相互作用力变化预 测装置,用于预测对蛋白质施加突变前后的2个蛋白质间的相互作用 力的变化,上述相互作用力变化预测装置具备:结合3残基组数据作 成部,参照表示构成发生相互作用的2个蛋白质的原子的位置的复合 体立体结构信息,取得多个3残基组,并制作表示取得的多个上述3 残基组的结合3残基组数据,上述3残基组表示在上述2个蛋白质的 结合部位在一定距离内接近的1对氨基酸残基对、和与上述氨基酸残 基对中的一个氨基酸残基在氨基酸序列上相邻的N末端侧或C末端侧 的1个氨基酸残基;突变后3残基组数据作成部,参照表示施加突变 的蛋白质的氨基酸残基的位置和突变后的氨基酸残基的种类的突变信 息,分别关于上述结合3残基组数据所示的多个上述3残基组,制作 突变后3残基组数据,该突变后3残基组数据表示将上述施加突变的 蛋白质的氨基酸残基的位置的氨基酸残基的种类取代为上述突变后的 氨基酸残基的种类后的3残基组;相互作用分值算出部,参照3残基 组表,算出由上述结合3残基组数据所示的多个上述3残基组的相互 作用力的平均值结合相互作用分值、和由上述突变后3残基组数据所 示的多个上述3残基组的相互作用力的平均值突变后相互作用分值, 上述3残基组表是表示任意3个氨基酸残基的种类的3残基组文字列、 和表示由上述3残基组文字列所示种类的3个氨基酸残基在2个蛋白 质的结合部位构成上述3残基组时的相互作用力的3残基组分值对应 的数据;相互作用力变化预测值算出部,作为用于预测施加由上述突 变信息所指定的突变前和施加该突变后的上述2个蛋白质间的相互作 用力的变化的相互作用力变化预测值,算出上述结合相互作用分值和 上述突变后相互作用分值的差分。

根据该结构,使用表示3残基组文字列和相互作用力的3残基组 表,求出结合3残基组数据和突变后3残基组数据的相互作用力。由 于氨基酸残基的种类为20种,3残基组文字列存在20×20×20=8000。 即,在3残基组表中,3残基组文字列与相互作用力的组合存在8000 种。因此,求出结合3残基组数据和突变后3残基组数据的相互作用 力时,只需从最大8000的数据中寻找与表示各3残基组数据的文字列 一致的3残基组文字列即可。与现有技术中使用3200万个数据数目的 数据相比,即使在较少的计算资源下,也能够高速地预测出突变前后 相互作用力如何变化。

此外,本发明不仅能够实现具备这样特征性的处理部的相互作用 力变化预测装置,还能够实现以相互作用力变化预测装置所包含的特 征性处理部执行的处理为步骤的相互作用力变化预测方法。另外,也 能够实现由计算机执行相互作用力变化预测方法所包含的特征性步骤 的程序。并且,当然也能够使这样的程序通过CD-ROM(Compact  Disc-Read Only Memory)等计算机能够读取的非易失性的储存介质或 因特网等通信网络来流通。

发明效果

根据本发明,即使在较少的计算资源下,也能够使用已知的复合 体立体结构,在发生相互作用的2个蛋白质内的1个蛋白质的相互作 用部位上施加突变的情况下,预测其相互作用力如何变化。

附图说明

图1是表示本发明实施方式的相互作用力变化预测装置的整体结 构的图。

图2是表示3残基组表作成部的处理流程的图。

图3是表示3残基组数据作成部的处理流程的图。

图4是蛋白质间结合部位的氨基酸残基的示意图。

图5是表示蛋白质间结合部位的氨基酸残基的例子的图。

图6是表示3残基组数据的例子的图。

图7是表示3残基组表作成处理的详细处理的流程图。

图8是表示3残基组表的例子的图。

图9是表示相互作用力变化预测部执行处理的流程图。

图10是表示蛋白质间结合部位的氨基酸残基的例子的图。

图11是表示突变后的蛋白质间结合部位的氨基酸残基的例子的 图。

图12是表示由输入的复合体立体结构信息制作的3残基组数据的 例子的图。

图13是表示由突变后的蛋白质制作的3残基组数据的例子的图。

图14是表示相互作用分值算出部的处理流程的图。

图15是表示氨基酸残基对表的例子的图。

图16是表示相互作用力变化预测装置的外观图。

图17是表示相互作用力变化预测装置的硬件构成的框图。

图18是预测值与实验值的相关图。

图19是表示现有的蛋白质间相互作用预测装置的功能性构成的框 图。

具体实施方式

下面,参照附图,对于本发明的具体实施方式进行说明。

图1是表示本发明实施方式的相互作用力变化预测装置的整体构 成的图。

相互作用力变化预测装置100是用于预测对蛋白质施加突变前后 的2个蛋白质间的相互作用力的变化的装置,具备复合体结构数据库 152、3残基组表作成部202和相互作用力变化预测部201。

复合体结构数据库152是表示2个蛋白质的结合状态的复合体的3 维结构信息(复合体立体结构信息)的数据库,由HDD(硬盘驱动器: Hard Disk Drive)或存储器等构成。

3残基组表作成部202,根据存储在复合体结构数据库152中的复 合体立体结构信息生成3残基组表151。3残基组表151是表示每个3 残基组中对应于相互作用力的分值的数据表,其中,3残基组表示在2 个蛋白质的结合部位上在一定距离内接近的1对氨基酸残基对、和该 氨基酸残基对中的一个氨基酸残基在氨基酸序列上相邻的N末端侧或 C末端侧的1个氨基酸残基。

相互作用力变化预测部201,基于复合体立体结构信息101、突变 信息102和3残基组表151,预测对蛋白质施加突变前后的2个蛋白质 间的相互作用力的变化,并输出作为预测结果的相互作用力变化预测 值103。这里,复合体立体结构信息101表示施加突变前的发生相互作 用的2个蛋白质的立体结构。即,复合体立体结构信息101表示构成 发生相互作用的2个蛋白质的原子的位置。另外,突变信息102表示 施加突变的蛋白质的氨基酸残基的位置和突变后的氨基酸残基的种 类。此外,相互作用力变化预测值103是用于预测施加由突变信息102 所指定的突变前和施加突变后的2个蛋白质间的相互作用力的变化的 值。相互作用力变化预测部201包括结合3残基组数据作成部211、突 变后3残基组数据作成部212、相互作用分值算出部213和相互作用力 变化预测值算出部214。关于相互作用力变化预测部201所包含的各个 处理部的详细情况将在下面进行说明。

下面,对于3残基组表作成部202执行的处理进行说明。

图2是表示3残基组表作成部202执行的处理的流程图。

3残基组表作成部202从复合体结构数据库152读取1个复合体立 体结构信息(S1)。

结合3残基组数据作成部211由读取的复合体立体结构信息104 制作3残基组数据130(S2)。3残基组数据130是表示在生成3残基 组表151时暂时生成的与3残基组的相互作用力相对应的分值的数据 表。

3残基组表作成部202制作汇总了3残基组数据130的3残基组表 151(S3)。其中,关于3残基组表151的制作方法在后面说明。

3残基组表作成部202,判定是否对于复合体结构数据库152所含 的全部复合体立体结构信息实行了S1~S3的处理(S4)。

在存在S1~S3的处理未完成的复合体立体结构信息时(S4为 NO),3残基组表作成部202对于该复合体立体结构信息实行S1~S3 的处理。

在判定对于全部的复合体立体结构信息S1~S3的处理完成的情况 下(S4为YES),3残基组表作成部202输出3残基组表151,结束处 理。

下面,对于3残基组数据作成处理(图2的S2)的详细情况进行 说明。图3是表示3残基组数据作成处理(图2的S2)的详细情况的 流程图。

3残基组表作成部202,从复合体立体结构信息104中读取发生相 互作用的2个蛋白质的氨基酸残基的3维结构信息(S21)。图4是示 意性地表示发生相互作用的2个蛋白质的图。蛋白质501的氨基酸残 基511和蛋白质502的氨基酸残基515在两蛋白质的结合部位接近。 另外,氨基酸残基512位于氨基酸残基511在氨基酸序列上相邻的N 末端侧,氨基酸残基513位于C末端侧。并且,氨基酸残基516位于 氨基酸残基515在氨基酸序列上相邻的N末端侧,氨基酸残基517位 于C末端侧。在S21中读取的3维结构信息中包含蛋白质501和蛋白 质502的氨基酸残基的序列、以及构成该氨基酸残基的各原子的三维 坐标。

3残基组表作成部202,对于读取的3维结构信息所表示的2个蛋 白质的氨基酸残基,判定其氨基酸残基对是否在结合部位接近(S22)。 即,如果3残基组表作成部202判定在蛋白质间存在Cα原子间距离在 12×10-10m以下的氨基酸残基对,则判定2个蛋白质的氨基酸残基对 在结合部位接近;若不存在这样的氨基酸残基对,则判定2个蛋白质 的氨基酸残基对在结合部位上不接近。图5是表示发生相互作用的2 个蛋白质的结合部位的氨基酸残基的图。在图5表示的例子中,蛋白 质501的氨基酸残基中与蛋白质502接触的氨基酸残基511是T(苏氨 酸),蛋白质502的氨基酸残基中与蛋白质501的氨基酸残基511接触 的氨基酸残基515是Q(谷氨酰胺)。另外,与氨基酸残基511在氨基 酸序列上相邻的N末端侧的氨基酸残基512是S(丝氨酸),与氨基酸 残基511在氨基酸序列上相邻的C末端侧的氨基酸残基513是Y(酪 氨酸),与氨基酸残基515在氨基酸序列上相邻的N末端侧的氨基酸残 基516是T(苏氨酸),与氨基酸残基515在氨基酸序列上相邻的C末 端侧的氨基酸残基517是A(丙氨酸)。另外,氨基酸残基511与氨基 酸残基515的Cα原子间距离为9.60×10-10m,由于在12×10-10m以下, 所以可以判定氨基酸残基511与氨基酸残基515相接近。

在判定结合部位上氨基酸残基对接近的情况下(S22为YES),3 残基组表作成部202更新3残基组数据130(S23)。图6是表示3残基 组数据130的一例的图。在3残基组数据130中设有5栏,在栏621 中以连续的3文字的文字列表示氨基酸残基511、515和516这3个残 基组。在栏622中以连续的3文字的文字列表示氨基酸残基511、515 和517这3个残基组。在栏623中以连续的3文字的文字列表示氨基 酸残基511、515和512这3个残基组。在栏624中以连续的3文字的 文字列表示氨基酸残基511、515和513这3个残基组。在栏625中表 示氨基酸残基511和氨基酸残基515的Cα原子间距离。即,3残基组 表作成部202,通过在3残基组数据130中追加行来更新3残基组数据 130。在图5所示的例子中,如图6所示,在栏621、622、623和624 中分别追加文字列“TQT”、“TQA”、“QTS”和“QTY”。例如,在栏 622中追加的文字列“TQA”表示氨基酸残基511、515和517分别为 T、Q和A。另外,在栏625中追加了作为氨基酸残基511的T和作为 氨基酸残基515的Q之间的Cα原子间距离9.60×10-10m。

3残基组表作成部202,对于复合体立体结构信息104所包含的所 有氨基酸残基,判定是否接近的判定处理(S22)和3残基组数据的更 新处理(S23)是否完成(S24)。在存在上述处理未完成的氨基酸残基 的情况下(S24为NO),3残基组表作成部202,从复合体立体结构信 息104读取未处理的氨基酸残基(S21),并且执行S22和S23的处理。 如果对于全部的氨基酸残基的上述处理完成的话(S24为YES),则3 残基组表作成部202结束处理。

下面,对于3残基组表151作成处理(图2的S3)详细地进行说 明。图7是表示3残基组表151作成处理(图2的S3)的详细处理的 流程图。

3残基组表作成部202,参考3残基组数据130,基于Cα原子间 距离,算出3残基组数据130的对准的行所含的3残基组的二级分值 (S31)。例如,以图6所示的3残基组数据130为例进行说明,3残基 组表作成部202,根据以下的(式1),分别对于3残基组数据130的 行130A所示的4个3残基组(TQT、TQA、QTS,QTY)计算二级分 值。即,在Cα原子间距离在6×10-10m以下的情况下,将二级分值计 算为1;在大于6×10-10m的情况下,将二级分值计算为(12-Cα原子 间距离)/6。行130A所示的4个3残基组的Cα原子间距离为9.60× 10-10m。因此,二级分值计算为(12-9.60)/6=0.4。此外,3残基组 数据130中记录的Cα原子间距离为12×10-10m以下。因此,二级分值 取从0到1的值。

…(式1)

关于行130A的3残基组,如以下的表1所示,各3残基组的二级 分值求得为0.4。

[表1]

 3残基组   二级分值  TQT   0.4  TQA   0.4  QTS   0.4  QTY   0.4

表1...行130A所示的3残基组的二级分值

3残基组表作成部202,对于3残基组数据130所含的全部行,反 复执行二级分值算出处理(S31)(循环(LOOP)A)。

然后,3残基组表作成部202,对每个3残基组的种类,计算通过 循环A的处理求出的二级分值的合计值,将该合计值作为分值追加到 3残基组表151中(S32)。图8是表示3残基组表151的一例的图。在 3残基组表151中设有两个栏。在栏631中以连续的3文字的文字列表 示氨基酸残基的3残基组。该文字列是与图6的3残基组数据130的 栏621~624中所示的文字列相同的文字列。在栏632中表示栏631所 示的3残基组的分值。例如,在S32的处理中,3残基组“AAW”的 分值求得为0.18。另外,由于氨基酸的种类数为20,所以3残基组存 在20×20×20=8000种。因此,3残基组表151所示的3残基组的种 类数也为8000。

然后,3残基组表作成部202,算出3残基组表151的栏632所示 的全部分值的平均值,将大于算出的平均值的分值修正为算出的平均 值(S33)。例如,在平均值求得为2.85时,将大于2.85的分值修正为 2.85。图8表示分值修正后的3残基组表151,3残基组“GNF”和“GNL” 等的分值被修正为2.85。

通过以上说明的处理,由3残基组表作成部202制作出3残基组 表151。

下面,对于相互作用力变化预测部201使用制作出的3残基组表 151,预测相互作用力的变化的处理进行详细说明。图9是表示相互作 用力变化预测部201所执行的处理的流程图。

在相互作用力变化预测部201中,输入复合体立体结构信息101。 根据复合体立体结构信息101,得到图10所示的蛋白质间结合部位的 氨基酸残基的信息。即,蛋白质501的氨基酸残基中与蛋白质502接 触的氨基酸残基511是S(丝氨酸),蛋白质502的氨基酸残基中与蛋 白质501的氨基酸残基511接触的氨基酸残基515是G(甘氨酸)。另 外,与氨基酸残基511在氨基酸序列上相邻的N末端侧的氨基酸残基 512是F(苯丙氨酸),与氨基酸残基511在氨基酸序列上相邻的C末 端侧的氨基酸残基513是L(亮氨酸),与氨基酸残基515在氨基酸序 列上相邻的N末端侧的氨基酸残基516是K(赖氨酸),与氨基酸残基 515在氨基酸序列上相邻的C末端侧的氨基酸残基517是T(苏氨酸)。

相互作用力变化预测部201,基于复合体立体结构信息101和突变 信息102,制作在复合体立体结构信息101所示的蛋白质上施加了突变 信息102所示的突变后的蛋白质的立体结构作为突变后复合体立体结 构信息133(S4)。作为一例,突变信息102表示氨基酸残基511在N (天冬酰胺)上施加突变这一信息。即,图10所示的蛋白质间结合部 位的氨基酸残基中氨基酸残基511从S变更为N,得到图11所示的突 变后的蛋白质间结合部位的氨基酸残基的信息作为突变后复合体立体 结构信息133。

结合3残基组数据作成部211,由复合体立体结构信息101制作结 合3残基组数据131(S5)。结合3残基组数据作成处理(S5),与图2 所示的3残基组表作成部202执行的3残基组数据作成处理(S2)相 同。因此,这里不再重复详细的说明。通过该处理(S5),根据表示图 10所示的蛋白质间结合部位的氨基酸残基的复合体立体结构信息101, 制作图12所示的结合3残基组数据131。结合3残基组数据131的各 栏与图6所示的3残基组数据130的各栏相同。因此这里不再重复详 细的说明。如图12所示,蛋白质间结合部位的3残基组的文字列是 “SGK”、“SGT”、“GSF”和“GSL”。另外,存在于结合部位的作为 氨基酸残基511的S和作为氨基酸残基515的G之间的Cα原子间距 离为9.86×10-10m。

另外,突变后3残基组数据作成部212,根据突变后复合体立体结 构信息133,制作突变后3残基组数据132(S6)。突变后3残基组数 据作成处理(S6)与图2所示的3残基组表作成部202执行的3残基 组数据作成处理(S2)相同。因此,这里不再重复详细的说明。通过 该处理(S6),根据表示图11所示的蛋白质间结合部位的氨基酸残基 的突变后复合体立体结构信息133制作图13所示的突变后3残基组数 据132。突变后3残基组数据132的各栏与图6所示的3残基组数据 130的各栏相同。因此,这里不再重复详细的说明。如图13所示,蛋 白质间结合部位的3残基组的文字列是“NGK”、“NGT”、“GNF”和 “GNL”。另外,存在于结合部位的作为氨基酸残基511的N和作为氨 基酸残基515的G之间的Cα原子间距离为9.86×10-10m。另外,这里 假定各氨基酸残基的Cα原子的坐标不变化。因此,栏625所示的Cα 原子间距离在图12所示的结合3残基组数据131和图13所示的突变 后3残基组数据132为相同的值。

接着,相互作用分值计算部213,基于结合3残基组数据131和3 残基组表151,算出表示复合体立体结构信息101所示的蛋白质间的相 互作用力的结合相互作用分值135。另外,相互作用分值算出部213, 基于突变后3残基组数据132和3残基组表151,算出表示突变后复合 体立体结构信息133所示的蛋白质间的相互作用力的突变后相互作用 分值136(S7)。关于相互作用分值算出处理(S7)的详细情况在后面 说明。

相互作用力变化预测值算出部214,通过从突变后相互作用分值 136中减去结合相互作用分值135,算出表示突变前后的相互作用力的 变化的相互作用力变化预测值103(S8)。

下面,对于相互作用分值算出处理(S7)的详细情况进行说明。 图14是表示相互作用分值算出处理(S7)的详细情况的流程图。

首先,相互作用分值算出部213,从结合3残基组数据131中读取 1行连续表示氨基酸残基种类的3文字的文字列(S71)。即,在图12 所示的结合3残基组数据131中,读取1行分别在栏621、622、623 和624显示的3文字的文字列“SGK”、“SGT”、“GSF”和“GSL”。

相互作用分值算出部213,从3残基组表151中检索S71处理中读 取的3文字的文字列所示的3残基组的分值,作为3残基结构指标计 算出检索到的分值的平均值(S72)。即,相互作用分值算出部213,从 3残基组表151的栏631中检索与S71处理中读取的3文字的文字列一 致的文字列,并算出与该文字列对应的栏632所示的3残基组的分值 的平均值。例如,在如上所述读取3文字的文字列“SGK”、“SGT”、 “GSF”和“GSL”时,相互作用分值算出部213,从图8所示的3残 基组表151中提取出分别与文字列“SGK”、“SGT”、“GSF”和“GSL” 相对应的分值2.85、2.85、2.85和2.85,并算出这4个分值的平均值 2.85。

另外,相互作用分值算出部213决定表示由复合体立体结构信息 101所示的蛋白质结合部位的氨基酸残基511和氨基酸残基515构成的 氨基酸残基对的相互作用力的氨基酸对指标(S73)。即,在S71中读 取的3文字的文字列的前两个文字表示氨基酸残基对。例如,在上述 例子中,“SG”表示氨基酸残基对。相互作用分值算出部213,参照图 15所示的氨基酸残基对表310,决定表示氨基酸残基对的相互作用力 的氨基酸对指标。在氨基酸残基对表310中设有两栏。在栏311中以 连续的2文字的文字列表示氨基酸残基对。在栏312中表示氨基酸残 基对的氨基酸对指标。此外,由于氨基酸的种类数为20,所以氨基酸 残基对存在20×20=400种。因此,3残基组表151所示的3残基组的 种类数也为400。但是,由于在具有彼此之间顺序不同的关系的氨基酸 残基对(例如,“GS”和“SG”)中,氨基酸对指标是相同的值,因此 也可以将3残基组表151所示的3残基组的种类数设为200。氨基酸残 基对的氨基酸对指标的实例记载于非专利文献4中。因此,不再重复 详细的说明。通过氨基酸残基对表310,将与氨基酸残基对“GS”相 对应的氨基酸对指标确定为0.1。

非专利文献4:Betancourt MR et al.,“Pair potentials for protein  folding:Choice of reference states and sensitivity of predicted native states  to variations in the interaction schemes”,PROTEIN SCIENCE volume 8, Issue 2,1999

相互作用分值算出部213,分别对于在S72中决定的3残基组结构 指标和在S73中决定的氨基酸对指标,加上不同的规定系数,从而计 算部分相互作用分值(S74)。即,由于以相同的权重算出3残基组结 构指标和氨基酸对指标,所以根据3残基组结构指标的值的宽度为 2.85、氨基酸对指标的值的宽度为2,相互作用分值算出部213按照以 下的(式2)算出部分相互作用分值。

部分相互作用分值=氨基酸对指标×2.85-3残基组结构指标×2

                                           ...(式2)

这里,进行减法运算是由于氨基酸对指标和3残基组结构指标的 极性不同。即,氨基酸对指标的值越大,表示2个蛋白质越互相排斥, 值越小,表示2个蛋白质越相互吸引;而3残基组结构指标的值越大, 表示2个蛋白质越相互吸引,值越小,表示2个蛋白质越互相排斥。 其中,也可以改变在各指标上相乘的系数。

在上述例子中,3残基组的结构指标为2.85,氨基酸对指标为0.1, 因此部分相互作用分值算得为-5.415。

相互作用分值算出部213,将算出的部分相互作用分值的平均值作 为暂时的相互作用分值算出(S75)。

相互作用分值算出部213,对于结合3残基组数据131的全部行, 判定S71~S75的处理是否结束(S76),在存在未结束的行时(S76为 NO),重复进行S71以后的处理。如果全部行的处理结束(S76为YES), 则将此时求出的暂时相互作用分值作为结合相互作用分值135输出。

另一方面,相互作用分值算出部213,也对于突变后3残基组数据 132实行图14表示的处理,算出突变后相互作用分值136。即,相互 作用分值算出部213,代替结合3残基组数据131对突变后3残基组数 据132实行图14表示的处理。由此,代替结合相互作用分值135,算 出突变后相互作用分值136。

通过以上的处理,作为结合相互作用分值135,计算为-5.415; 作为突变后相互作用分值136,计算为-5.035。其结果,在上述相互 作用力变化预测值算出处理(S8),相互作用力变化预测值103计算为 0.38(=-5.035-(-5.415))。

其中,相互作用力变化预测装置100可以通过计算机执行。

图16是相互作用力变化预测装置100的外观图。相互作用力变化 预测装置100包括:计算机434、用于向计算机434发出指示的键盘 436和鼠标438、用于提示计算机434的演算结果等信息的显示器432、 用于读取由计算机434执行的程序的CD-ROM(只读存贮型光盘: Compact Disc-Read Only Memory)装置440和通信调制解调器(未图 示)。

用于预测相互作用力的变化的程序,储存在计算机能够读取的介 质CD-ROM42中,由CD-ROM装置440读取。或者也可以通过计算 机网络426由通信调制解调器读取。

图17是表示相互作用力变化预测装置100的硬件构成的框图。计 算机434包括CPU(中央处理器:Central Processing Unit)444、ROM (只读存储器:Read Only Memory)446、RAM(随机存取存储器: Random Access Memory)448、硬盘450、通信调制解调器452和总线 454。

CPU444通过CD-ROM装置440或通信调制解调器452执行读取 的程序。ROM446储存计算机434的运行所必须的程序和数据。 RAM448储存CPU444所执行的程序和在执行程序时生成的中间数据 等。硬盘450储存程序和数据等。通信调制解调器452通过计算机网 络426与其他计算机进行通信。总线454将CPU444、ROM446、 RAM448、硬盘450、通信调制解调器452、显示器432、键盘436、鼠 标438和CD-ROM装置440相互连接。

下面,关于利用本实施方式中表示的相互作用力变化预测装置100 的相互作用力变化预测值的合理性进行考察。

使用本实施方式的相互作用变化的预测方法,将非专利文献5记 载的对接基准数据(Docking benchmark data)的刚性体(Rigid-body) 的63的复合体PDB数据作为复合体结构数据库152,制作3残基组表 151。另外,参考非专利文献6、非专利文献7和非专利文献8所示的 复合体信息和在结合部位进行了1个突变的突变体的结合自由能变化 量,使用PDB-ID:1B0G、1MLC、1VFB、2DQJ的PDB数据作为复 合体立体结构信息101。进一步,将各非专利文献所示的突变信息102 作为输入信息,得到39的相互作用力变化预测值103。作为预测值和 实验值的相关图,图18表示将该算出的相互作用力变化预测值103作 为X轴,将各文献的结合自由能变化量作为Y轴绘制的图表。在39 的预测值中,28的预测值的正负与实验值的正负一致,准确度约为 72%。其中,在仅使用3残基组结构指标进行同样的试验时,准确度约 为62%。即,通过使用3残基组结构指标和氨基酸对指标两者算出相 互作用力变化预测值103,能够提高其精度。

另外,相互作用力不仅随着结合部位的2个氨基酸残基而变化, 也随着位于其周围的氨基酸残基而变化。因此,通过使用3残基组, 能够以良好的精度预测相互作用力的变化。

非专利文献5:Julian Mintseris,et al.,“Protein-Protein Docking  Benchmark 2.0:An update”,PROTEINS volume 60,Issue 2,2005

非专利文献6:S.M.Lippow et al.,“Computational design of  antibody affinity improvement beyond in vivo maturation”,Nature  Biotechnology volume 25,2007

非专利文献7:M.Shiroishi,et al.,“Structural Consequences of  Mutations in Interfacial Tyr Residues of a Protein Antigen-Antibody  Complex”,THE JOURNAL OF BIOLOGICAL CHEMISTRY volume 282, number 9,2007

非专利文献8:I.Mandrika,et al.,“Improving the affinity of antigens  for mutated antibodies by use of statistical molecular design”,Journal of  Peptide Science volume 14,2008

如上述说明,根据本实施方式的相互作用力变化预测装置100的 构成,通过将复合体立体结构信息101和突变信息102作为输入信息, 参照由8000种3残基组文字列和3残基组分值构成的3残基组表151, 即使在较少的计算资源下也能够进行蛋白质间相互作用变化的预测。

以上,对于本发明实施方式的相互作用力变化预测装置100进行 了说明,但本发明并不局限于该实施方式。

例如,在本实施方式中,表示了蛋白质501和蛋白质502形成1 对氨基酸残基结合的复合体的例子,但结合的氨基酸残基对也可以存 在多个。

另外,在本实施方式中,作为结合部位的氨基酸残基对的判定基 准,将氨基酸残基的Cα原子间距离在12×10-10m以下的残基对设为结 合部位的氨基酸残基对,但也可以使用将氨基酸残基的侧链的重心间 的距离在6.5×10-10m以下的残基对设为结合部位的氨基酸残基对等的 其他的判定基准。

另外,在本实施方式中,3残基组表151的栏631中表示的3残基 组,通过汇总3残基组数据130的栏621~624所示的3残基组而制作, 但也可以区别N末端侧的氨基酸残基和C末端侧的氨基酸残基进行汇 总。即,可以区别进行栏621和栏623的汇总、栏622和栏624的汇 总。由此,能够更准确地进行相互作用力的变化预测。其中,3残基组 表151的行数为2倍。

另外,在本实施方式中,按照上述(式1)计算二级分值,将二级 分值的总和作为3残基组表151中的3残基组的分值,但也可以将3 残基组的出现频率或出现概率作为3残基组的分值,还可以将3残基 组数据130的栏625所示的Cα原子间距离的平均值作为3残基组的分 值。

另外,在本实施方式中,在相互作用分值算出部213中进行使用 了3残基组结构指标和氨基酸对指标的相互作用分值(结合相互作用 分值135和突变后相互作用分值136)的计算。3残基组结构指标,在 3残基组形成结合部位的频率高、更为接近的情况下成为较大的数值, 表示从现有的复合体立体结构数据的统计出发的结合力的高的程度。 另外,氨基酸对指标表示从氨基酸残基的氢键、静电相互作用和疏水 相互作用的观点出发的氨基酸残基间的结合力的低的程度。因此,在 求取相互作用分值时,如上述(式2)所示,在3残基组结构指标上乘 上负的系数,再将两者相加。另外,其比率,如式2所示,氨基酸对 指标∶3残基组结构指标=2.85∶2。相互作用分值是同时具备经验的 结构指标和来自物理化学性质的指标的性质的指标。但是,也可以仅 使用3残基组结构指标计算相互作用分值,还可以改变3残基组结构 指标和氨基酸对指标的加算比例。

本次公开的实施方式应该认为在全部点上均为例示,并不起限制 作用。本发明的范围并不由上述的说明表示,而是通过权利要求表示, 包括与权利要求均等的意思及其范围内的所有变更。

产业上的可利用性

本发明能够适用于预测生物体或人工的各蛋白质的相互作用力的 变化的相互作用力预测装置等,特别是在生物化学、医药或制药等对 蛋白质进行研究的所有领域中有用。

符号说明

100:相互作用力变化预测装置;101、104:复合体立体结构信息; 102:突变信息;103:相互作用力变化预测值;130:3残基组数据; 131:结合3残基组数据;132:突变后3残基组数据;133:突变后复 合体立体结构信息;135:结合相互作用分值;136:突变后相互作用 分值;137:相互作用分值;151:3残基组表;152:复合体结构数据 库;201:相互作用力变化预测部;202:3残基组表作成部;211:结 合3残基组数据作成部;212:突变后3残基组数据作成部;213:相 互作用分值算出部;214:相互作用力变化预测值算出部;310:氨基 酸残基对表。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号