首页> 中国专利> 一种药物血脑屏障渗透性的预测方法

一种药物血脑屏障渗透性的预测方法

摘要

本发明公开了一种药物血脑屏障渗透性的预测方法,其利用基团贡献法和人工神经网络建立药物血脑屏障渗透性预测的非线性模型,该方法采用的人工神经网络建立预测模型,建立了一种预测药物血脑屏障渗透性的非线性模型,为药物血脑屏障渗透性的预测与评估,提供一种非线性的、更符合药物结构与性质之间关系的方法,是一种新的药物血脑屏障渗透性的预测方法。本发明基于基团贡献法和人工神经网络,建立预测药物血脑屏障渗透性的非线性预测模型,利用药物的分子结构预测其血脑屏障渗透性,克服传统实验难度大、耗时且昂贵等缺点,为药物血脑屏障渗透性的预测,提供一种更符合药物分子结构与血脑屏障渗透性之间的非线性关系的、准确性高、适用性强的预测方法。

著录项

  • 公开/公告号CN112750510A

    专利类型发明专利

  • 公开/公告日2021-05-04

    原文格式PDF

  • 申请/专利权人 合肥工业大学;

    申请/专利号CN202110060117.9

  • 申请日2021-01-18

  • 分类号G16C20/70(20190101);G16C20/50(20190101);G16H70/40(20180101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构32251 苏州翔远专利代理事务所(普通合伙);

  • 代理人王华

  • 地址 230000 安徽省合肥市屯溪路193号

  • 入库时间 2023-06-19 10:51:07

说明书

技术领域

本发明涉及药物血脑屏障渗透性计算技术领域,特别地涉及一种基于基团贡献法和人工神经网络的药物血脑屏障渗透性的预测方法,适用于根据药物分子结构信息对血脑屏障渗透性进行预测。

背景技术

定量结构—活性关系(Quantitative structure-activity relationship,QSAR)是研究化合物结构特征和活性之间关系的重要方法,最终目的是确定生物活性受哪些参数的影响,通过建立数学预测模型实现对未知化学品的性质或活性进行预测、评价和筛选等,为进一步地安全评价提供基础数据。Free和Wilson于二十世纪六十年代提出了一种QSAR研究方法,即Free-Wilson基团贡献法。该法的理论依据是从结构上将一种化合物分成若干个官能团或结构碎片,并假定每种官能团或结构碎片对化合物某种特效都具有独立贡献。它假定不同分子或混合物中同一官能团的贡献完全相同,把纯物质或混合物的性质看成是构成它们的基团对此性质的加和。随着分子模型、结构设计和计算机模拟技术的发展,广泛运用于药物设计和活性预测等方面研究,且取得了显著成果。

在开发治疗神经系统疾病的药物中发现,大脑中存在的中枢神经系统屏障——血脑屏障,成为了药物到达目标之前的主要障碍。血脑屏障主要调节药物向大脑的渗透性。其存在限制了几乎100%的大分子和98%的小分子药物的渗透。因此,在开发中枢神经系统新药中,及早筛选新化合物实体的血脑屏障渗透性不仅对于中枢神经系统化合物(以评估是否达到治疗靶点)至关重要,而且对于其可渗透至大脑的外周活性化合物也至关重要,以免产生副作用。

在CNS药物研发对血脑屏障渗透性进行确认时,通常考察的指标是药物的脑血比,即在稳定状态下,药物在脑和血浆中的分配比的对数值被定义为脑血比,简称为logBB(logBB=log(Cbrain/Cblood))。实际上,logBB的实验测定通常非常困难,耗时且昂贵,并且需要足够量的纯化合物以及大量的动物实验,因此不适合以高通量方式提供结果。因此,人们对能够快速预测分子的血脑屏障渗透能力的计算方法越来越感兴趣,该方法良好,可靠且易于应用。且这种预测模型可以在药物开发过程中广泛使用,尤其是在中枢神经系统领域。

人工神经网络可以有效地计算非线性数据,可以处理大型数据集,并且可以用于多个输入输出变量,可在血脑屏障预测模型构建使用。卢小泉等人(中国发明专利,CN201010583391.6)发明了一种基于遗传算法和人工神经网络的药物分子药代动力学性质和毒性预测方法。Khan等人在开发PNP通过血脑屏障内皮细胞转运的数学模型时,采用人工神经网络(ANN)处理来自体外血脑屏障实验的实验数据确定动力学速率参数。

本发明采用的是基团贡献法结合人工神经网络的方法,采用的人工神经网络建立预测模型,旨在建立一种预测药物血脑屏障渗透性的非线性模型,为药物血脑屏障渗透性的预测与评估,提供一种非线性的、更符合药物结构与性质之间关系的方法,是一种新的药物血脑屏障渗透性的预测方法。

发明内容

本发明的目的在于克服现有技术中预测准确性差、适用性弱的缺陷,提供一种基于基团贡献法和人工神经网络的药物血脑屏障渗透性的预测方法,提高模型预测的准确性和适用性。

本发明的目的可以通过以下技术方案来实现:

一种基于基团贡献法和人工神经网络的药物血脑屏障渗透性的预测方法,包括以下步骤:

(1)获取已知血脑屏障渗透性的药物后,导入分子描述符计算软件中,计算获得多种分子描述符;

(2)将所述分子描述符数值集合变换成所述药物的特征数据集,并将所述药物的特征数据集与所述药物的血脑屏障渗透性结合形成所述药物的特征矩阵;

(3)将所述数据集随机划分成训练集X1和测试集X2,训练集X1用于神经网络训练,调整模型参数,建立预测模型,测试集X2用于测试验证所开发的神经网络模型的预测能力;

(4)将训练集X1和测试集X2导入人工神经网络进行训练,确定人工神经网络模型的参数;

(5)将待预测药物的分子描述符转换成特征向量的形式,根据人工神经网络模型进行预测。

优选的,步骤(1)中所述获取分子描述符的种类包括:分子结构基团描述符、物理化学性能描述符和生物学描述符。

优选的,步骤(2)中所述药物的特征数据集作为模型的输入参数,所述药物的血脑屏障渗透性参数作为输出参数。

优选的,步骤(3)中所述训练集X1和测试集X2的划分方法为:将数据集的90%作为训练集X1,将数据集的10%作为测试集X2。

优选的,步骤(4)中所述的人工神经网络架构是输入层,隐藏层,输出层的神经网络。

优选的,步骤(4)中,采用前馈神经网络传播算法中的梯度下降算法或反向传播算法对数据集进行训练。

优选的,步骤(4)中,所述确定人工神经网络模型的参数包括隐藏层数量,每一层的激活函数,每一层的神经元数量,调整模型的训练参数。

优选的,所述分子结构基团描述符通过UNIFAC基团贡献法拆分获得各个分子基团。

优选的,所述物理化学性能描述符包括分子量、脂水分配系数、氢键供体能力、氢键受体能力、极化率。

优选的,所述生物学描述符包括血浆蛋白结合率和P-糖蛋白高亲和力底物位点结合率。

优选的,所述人工神经网络模型的参数为:人工神经网络的拓扑结构为60×6×2×1,第一层隐藏层的传递函数为Logsig型激活函数,第二次隐藏层的传递函数为Tansig型激活函数,输出层的传递函数为purelin型激活函数,训练算法采用Levenberg-Marquardt算法。训练参数为训练目标最小误差0.1,学习速率0.01,最小性能梯度1e-6,最大确认失败次数50。

本发明的优点和有益效果:

(1)本发明简便易操作,只需提供药物的分子结构,就能快速预测其血脑屏障渗透性,在药物分子设计中,为提高药物的血脑屏障渗透性进行结构修饰时提供依据。

(2)本发明可自由添加分子描述符数据,只需对相同的数据集添加相同的描述符,具有通用性。

(3)本发明基于基团贡献法和人工神经网络,建立预测药物血脑屏障渗透性的非线性预测模型,利用药物的分子结构预测其血脑屏障渗透性,克服传统实验难度大、耗时且昂贵等缺点,为药物血脑屏障渗透性的预测,提供一种更符合药物分子结构与血脑屏障渗透性之间的非线性关系的、准确性高、适用性强的预测方法。

(4)本发明有效利用人工神经网络的统计学习能力和处理大型数据集的优势,对药物的分子描述符和人工神经网络参数进行优化,使药物血脑屏障渗透性的预测效率和能力显著提高。

附图说明

图1为神经网络模型示意图;

图2为模型的实验值和预测值交叉图;

图3为本发明实施例的的步骤流程图。

具体实施方式

下面结合实施例,对本发明作进一步地详细说明,但不用于限制本发明的实施方式。

实施例

本发明利用基团贡献法和人工神经网络建立药物血脑屏障渗透性的非线性模型,该模型将计算软件获得的分子描述符作为模型的输入参数,药物的血脑屏障渗透性参数作为输出参数,模型采用人工神经网络构建,通过输入药物的分子描述符,快速获得其血脑屏障渗透性的预测结果。本发明的技术方案的具体实现步骤如下:

(1)获取已知血脑屏障渗透性的药物,构建药物及其血脑屏障渗透性参数的数据库,导入分子描述符计算软件中,计算获得多种分子描述符:

采用数据调研的手段,获得300个相同数据来源的不同药物的血脑屏障渗透性参数,构建模型所需的数据库。保证实验条件或数据来源相同,避免不同研究人员测得数据之间的差异对模型准确性产生影响。绘制数据库中药物的3D分子结构及计算分子描述符:采用化学结构绘制软件绘制构建的数据库中药物的3D分子结构,且优化分子结构,获得更稳定的3D分子结构,导入分子描述符计算软件中,计算获得多种分子描述符。

本发明的实施例中总共构建了70种分子描述符(详见表一),这些描述符包括分子结构基团描述符、物理化学性能描述符和生物学描述符。其中分子结构基团描述符通过UNIFAC基团贡献法拆分获得各个分子基团;物理化学性能描述符包括分子量、脂水分配系数、氢键供体能力、氢键受体能力、极化率,生物学描述符包括血浆蛋白结合率和P-糖蛋白高亲和力底物位点结合率。

分子描述符的分类如表一所示:

表一

(2)将上述分子描述符数值集合变换成所述药物的特征数据集,并将药物的特征数据集与药物的血脑屏障渗透性结合形成药物的特征矩阵;

(3)数据库划分:

将上述获得分子描述符数值和血脑屏障渗透性参数的数据库,随机划分成90%训练集X1和10%测试集X2,训练集X1用于神经网络训练,调整模型参数,建立预测模型,测试集X2用于测试验证所开发的神经网络模型的预测能力。

(4)建立和训练人工神经网络模型

将获得数据库的分子描述符数值作为输入参数,血脑屏障渗透性参数作为输出参数,采用前馈神经网络中的反向传播算法训练人工神经网络模型,确定人工神经网络的结构,确定输入层、隐藏层和输出层的神经元数及激活函数。采用训练集X1的数据进行人工神经网络的训练。该项工作通过Matlab程序实现。

人工神经网络的拓扑结构为60×6×2×1,第一层隐藏层的传递函数为Logsig型激活函数,第二次隐藏层的传递函数为Tansig型激活函数,输出层的传递函数为purelin型激活函数,训练算法采用Levenberg-Marquardt算法。训练参数为训练目标最小误差0.1,学习速率0.01,最小性能梯度1e-6,最大确认失败次数50。

建立的人工神经网络模型预测血脑屏障渗透性参数的具体计算公式如下:

接着对模型进行测试和验证:采用测试集X2的数据对上述训练好的人工神经网络模型的预测性能、稳定性和泛化能力进行测试。相对误差RE,均方根误差RMSE和相关系数R各评估标准计算公式如下所述:

其中,P

药物血脑屏障渗透性参数的实验值与预测值如图2所示。模型的测试与验证结果如表三所示。

表三

(5)预测方法的应用:将待预测药物的分子描述符转换成特征向量的形式,根据人工神经网络模型进行预测。

建立好预测准确性高的模型后,无需对模型再训练和调整,输入药物相应的分子描述符,即可计算获得血脑屏障渗透性参数的预测结果。图3示出了本发明实施例的一种药物血脑屏障渗透性的预测模型对药物血脑屏障渗透性进行预测的步骤图。

本发明的实施例通过血脑屏障渗透性预测模型对药物进行预测,能够准确的的预测药物的血脑屏障渗透性,且使用范围较广。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。但在本发明基础上,对其进行多种修改、替代、组合或简化,这对本领域的专业技术人员来说是显而易见的。因此,在不偏离本发明精神或范围的基础上所做的修改或组合等置换方式,均属于本发明要求的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号