首页> 中国专利> 一种处理小分子和蛋白质相互作用的计算方法

一种处理小分子和蛋白质相互作用的计算方法

摘要

本发明涉及一种处理小分子和蛋白质相互作用的计算方法,包括以下步骤:(1)读入蛋白质和小分子配体文件数据;(2)判断蛋白质和小分子配体中的原子类型;(3)随机初始化小分子配体的位置和角度;(4)运行SearchProtein算法,优化小分子配体的坐标和角度,Chemscore公式作为评价函数;(5)达到最大迭代次数后终止计算;(6)分析结果,RMSD、对接自由能ΔG和对接位点的坐标,输出结果。与现有技术相比,本发明具有做到对污染物与生物大分子之间时候有作用作出迅速判断等优点。

著录项

  • 公开/公告号CN103049677A

    专利类型发明专利

  • 公开/公告日2013-04-17

    原文格式PDF

  • 申请/专利权人 同济大学;

    申请/专利号CN201110315297.7

  • 申请日2011-10-17

  • 分类号G06F19/12(20110101);

  • 代理机构31225 上海科盛知识产权代理有限公司;

  • 代理人赵志远

  • 地址 200092 上海市杨浦区四平路1239号

  • 入库时间 2024-02-19 18:33:18

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-10-09

    未缴年费专利权终止 IPC(主分类):G06F19/12 授权公告日:20151125 终止日期:20171017 申请日:20111017

    专利权的终止

  • 2015-11-25

    授权

    授权

  • 2013-05-15

    实质审查的生效 IPC(主分类):G06F19/12 申请日:20111017

    实质审查的生效

  • 2013-04-17

    公开

    公开

说明书

技术领域

本发明涉及一种计算毒理学领域,尤其是涉及一种处理小分子和蛋白质相互 作用的计算方法。

背景技术

随着人类社会的日益发展,人类所面对的环境问题愈发严重。各种各样的工、 农业废水、废气、废渣排放入人类所居住的公共环境,这些“三废”中往往含有许 多对人体有害的化合物。目前,世界上已经有许多国家和地区对“三废”的排放进 行了限制和禁止,对环境中污染物的含量做出了严格的限定,制定出相关的法律规 范以保护人体免受其伤害。污染物对人体造成损害的过程,是污染物进入体内,与 人体中某些重要蛋白结合的过程。这些被结合的蛋白,往往是在人的生命过程中占 有重要地位的蛋白。污染物分子与蛋白结合后,有两种行为,其一,使蛋白质的结 构发生改变,结构的改变往往引起蛋白质功能改变,使其丧失或改变原有的功能。 在通常情况下,污染物的存在会影响蛋白质的二级结构含量的变化;其二,蛋白质 的活性位点被污染物占据,一些功能性的分子无法结合,从而导致一些对人体健康 有关键作用的物质无法被合成或转化,人体最终将因缺乏这些应该被合成的重要物 质而受到损害。

污染物与蛋白质相互作用研究的重要性尤为突出。研究的重点在于:首先从宏 观的层面,污染物对蛋白质造成了何种影响,这种影响如何损害人体的健康。其次 从微观层面,污染物与蛋白质造成影响的机理是如何的。微观层面与宏观层面相结 合,将使我们获得污染物毒理的全面彻底的视角,使人们规避污染物,并增强人们 的环保意识,促使社会各界重视环境污染的问题,加大环境整治和杜绝污染的力度, 最终使地球环境更加健康。

计算化学,是指通过计算方法解决化学领域中的问题。计算化学中的计算方法 涵盖了各种方法。根据科学家研究的体系不同,可采用多种不同的计算方法。最常 用的计算方法为分子力学和量子化学计算。计算化学的目的更明确的来说是为了获 得研究对象的宏观物理或化学性质。这种宏观性质可分成两类:其一,对象的静态 平衡性质,例如两个物质作用的结合常数,一个体系的平均势能或是对象在液体中 的径向分布函数;其二是动态、非平衡性质,例如对象的相变,大分子的构象变化, 小分子在细胞膜或纳米管中的运动。

事实上,一个大分子体系的各种性质,是组成该大分子的许许多多微粒表现出 的量子态的平均,而获得微粒量子态的唯一途径便是解出薛定谔方程。这是因为薛 定谔方程,暗含了微粒的全部性质。在一个有限时间、有限能力的情况下,用薛定 谔方程对体系每一个微粒进行从头计算是不可能的,更是没有必要的,所以有必要 提出一种更为简单有效地方法,获得体系较为可靠的性质。为了解决上述问题,提 出了蒙特卡罗模拟法和分子动力学方法运用到计算化学的领域中。综上,计算方法 能够很好地预测对象的静态平衡性质。进而获得可靠的污染物毒性数据。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种处理小分子 和蛋白质相互作用的计算方法。

本发明的目的可以通过以下技术方案来实现:

一种处理小分子和蛋白质相互作用的计算方法,其特征在于,包括以下步骤:

(1)读入蛋白质和小分子配体文件数据;

(2)判断蛋白质和小分子配体中的原子类型;

(3)随机初始化小分子配体的位置和角度;

(4)运行SearchProtein算法,优化小分子配体的坐标和角度,Chemscore公式作 为评价函数;ChemScore评价函数是Eldridge等人在1997年提出的。在本文的程 序中,就使用了ChemScore函数作为能量评价的函数。ChemScore能量函数通过 以下公式对配体与蛋白质的能量进行评分:

ΔGbinding=ΔG0+ΔGhbondShbond+ΔGmetalSmetal+ΔGlipoSlipo+ΔGrotHrot

(5)达到最大迭代次数后终止计算;

(6)分析结果,RMSD(根均方偏移量)、对接自由能ΔG和对接位点的坐标, 输出结果。

所述的配体文件包括原子的类型、坐标以及键的类型信息。

所述的随机初始化小分子配体的位置和角度具体为:

小分子配体的位置和角度在活性中心周围的范围内随机产生, 并通过Presearch算法进行搜索和对接计算。

所述的Presearch算法为将蛋白质的原配体与蛋白质对接,找到活性位点并得 到原始对接自由能ΔG0,读入蛋白质和原分子配体文件数据,判断蛋白质和原配 体分子中的原子类型,随机初始化小分子配体的位置和角度;在蛋白质分子上加上 极性氢,并计算库尔曼电荷,将其保存后缀名为pdbqs的文件,小分子经过加氢, 计算电荷,并确定可旋转键后保存为pdbq文件;利用mkdpf4命令生成对接所需 要的格点参数文件,后缀名为.gpf,打开该文件,将网格中心修改为活性位点中心 的坐标;用mkdpf4命令生成dpf文件。

所述的SearchProtein算法为进行污染物小分子与蛋白质的分子对接,并得到 对接自由能ΔG,读入蛋白质和原分子配体文件数据,判断蛋白质和原配体分子中 的原子类型,随机初始化小分子配体的位置和角度;在蛋白质分子上加上极性氢, 并计算库尔曼电荷,将其保存后缀名为pdbqs的文件,小分子经过加氢,计算电荷, 确定可旋转键后保存为pdbq文件;利用mkdpf4命令生成对接所需要的格点参数 文件,后缀名为.gpf,打开该文件,将网格中心修改为活性位点中心的坐标;用 mkdpf4命令生成dpf文件。

与现有技术相比,本发明具有可以做到对污染物与生物大分子之间时候有作用 做出迅速判断,有利于提升生产效率。该技术关键原理简单,操作建议,容易学习, 可以在各个方面得到广泛应用。

具体实施方式

下面结合具体实施例对本发明进行详细说明。

实施例1

本发明分为Presearch和SearchProtein两个功能模块。主要利用ANSI C++语 言编写,可以运行在Windows和Linux操作系统下。程序包中有源程序和头文件 18个,主要流程为:受体和配体分子的读入,主要为mol2文件格式;受体和配体 分子预处理,主要是原子类型,单轴可旋转键的指定等等。PreSearch程序在运行 前需要准备presearch.txt文件;然后对小分子进行随机初始化,小分子初始化位置 在活性中心周围的范围内随机产生;然后利用Presearch进行搜 索和对接计算。计算得到对接的RMSD(根均方偏移量)、对接自由能ΔG和对接 位点的坐标。建立蛋白质数据库,利用SearchProtein模块对小分子和大分子进行 逆向对接实验。当SearchProtein程序计算完毕后,会生成文件。文件包含了每次 对接的能量以及对接位点的坐标。还另有文件分别给出ΔG与ΔG0以及原始配体 对接评价值与小分子污染物的对接评价值。

程序定义了输入文件,主要是定义受体分子文件名、配体分子文件名、初始化 中心坐标、初始化参数、搜索算法种类、搜索算法参数等等。除了受体分子文件名、 配体分子文件名必须指定外,其他参数可以指定,也可以使用默认值,程序的使用 比较简便易用。

程序的运行:ToxicitySearch程序里,主要优化的变量主要是小分子配体的中 心的三维坐标x,y和z,配体分子的三个笛卡尔角度d,β和γ,其主要运算步 骤为:(1)读入蛋白质和小分子配体文件,主要是SYBYL mol2文件格式,文件里 含有原子的类型、坐标以及键的类型;(2)判断蛋白质和小分子配体中的原子类型; (3)随机初始化小分子配体的位置和角度;(4)运行SearchProtein算法,优化小分子 配体的坐标和角度,Chemscore公式作为评价函数;(5)达到最大迭代次数,终止计 算;(6)分析结果,计算RMSD,输出结果。

实施例2

一种查找PFOS可能干扰的蛋白质受体的方法,利用逆向对接程序PreSearch 和逆向对接程序SearchProtein,从自建的蛋白质受体库中找到了4种蛋白可能与 PFOS结合,这些蛋白是磷酸二酯酶4D催化域、尿激酶催化域、II型碳酸酐酶和 IV型二肽酰肽酶,并简单分析了PFOS在这些蛋白质活性位点的情况。其具体过 程如下:

PreSearch程序在运行前需要准备presearch.txt文件。

./PreSearch-p presearch.txt-l result.log-o energy.txt

在工作中计算了10次,使能量的评价更平均。1a2c.mol2和1a2c-l.mol2分别 代表蛋白质的mol2文件和配体的mol2文件。每完成1个蛋白质的计算后,程序 会生成result.log文件和energy.txt文件。result.log文件详细地记录了对接的RMSD (根均方偏移量)、对接自由能和对接位点的坐标。

总结了每次对接的自由能ΔG(最后一列代表加上因柔性损失的能量)和对接 位点中心的坐标,并且该文件还作为SearchProtein程序的输入文件。

SearchProtein的输入文件即为上述的energy.txt文件,不过需要在文件开头加 上一行“ligand PFOS.mol2”。运行时需要输入以下的命令:

./SearchProtein-p energy.txt-l result.log-o finalenergy.txt

当SearchProtein程序计算完毕后,会生成result.log文件和finalenergy.txt文件。 result.log文件包含了每次对接的能量以及对接位点的坐标。而finalenergy.txt则分 别给出ΔG与ΔG0以及原始配体对接评价值与PFOS的对接评价值。

实施例3

一种研究污染物2,4-d与人血清蛋白HAS相互作用机理的方法,如实施例1 中所提到的,利用对接程序PreSearch,找出2,4-D可能取代雄激素和雌激素在HSA 上的位置,干扰这两种激素在人体内的运输,影响其发挥正常功能,可能使体内性 激素平衡失调,而2,4-D对甲状腺素在血清蛋白上的运输产生影响的可能性很小。

我们用Presearch对接的结果分析了结果相近的三个分子2,4-D,雌激素,雄激 素和HSA对接后的作用情况,对接选取的活性中心为IIA活性位点,值得一提的 是,在反复多次计算2,4-D和HSA的结合自由能时,发现一个与其他分子对接时 特殊的现象,2,4-D和HSA相互对接时计算的对接自由能值收敛与两个值而不是 一个值,这两个值分别为-34.0kJ/mol和-37.4kJ/mol。而包括雌激素,雄激素在内的 绝大部分分子都只收敛于一个值。

我们将四种分子,五种情况放在图上表示,为HSA活性位点附近的二级结构 示意图,四种小分子对接最稳定时在活性位点中的位置,绿色和青色为2,4-D两种 状态下的位置,蓝色和紫色为雌二醇和睾酮的位置,粉红色为甲状腺素。可以看出, 两种性激素的位置都在活性中心的下面,2,4-D的位置偏上,而甲状腺素分子较长, 贯穿上下,所以结合最稳定。

上述的对实施例的描述是为了便于该技术领域的普通技术人员能理解和应用 本发明。熟悉本领域技术的人员显然可以容易地对这些实施例做出各种修改,并把 在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明 不限于这里的实施例,本领域技术人员根据本发明的揭示,对于本发明做出的改进 和修改都应该在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号