首页> 中国专利> 药物筛选系统与药物筛选方法

药物筛选系统与药物筛选方法

摘要

一种药物筛选系统,包括编码模块、候选药物生成模块与药物排序模块。编码模块对药物表达式与至少一药物排序指标进行编码,以产生第一编码变量。候选药物生成模块依据第一编码变量,训练生成对抗网络,以产生多个候选药物,其中每一候选药物具有生成药物表达式与至少一生成药物排序指标。药物排序模块依据每一候选药物的至少一生成药物排序指标,对候选药物的强度进行排序来筛选药物。

著录项

  • 公开/公告号CN113053470A

    专利类型发明专利

  • 公开/公告日2021-06-29

    原文格式PDF

  • 申请/专利权人 财团法人工业技术研究院;

    申请/专利号CN202010522168.4

  • 发明设计人 林祺杰;萧杰仁;王界人;

    申请日2020-06-10

  • 分类号G16C20/70(20190101);

  • 代理机构11021 中科专利商标代理有限责任公司;

  • 代理人吴梦圆

  • 地址 中国台湾新竹县竹东镇中兴路4段195号

  • 入库时间 2023-06-19 11:39:06

说明书

技术领域

本发明涉及一种药物筛选系统与药物筛选方法。

背景技术

由筛选药物到成为真正有用的新药的过程可能会花费大量时程与经费。先导化合物优化(lead compound optimization)为药物开发流程中的重要阶段,且药物开发流程的平均耗费为414百万美元(约占药物开发流程23%)以及药物开发流程的研发时程为2年(约占药物开发流程15%)。在过去,利用仿真软件(simulation software)或专家经验(expertexperience)的优化模式,已难以应付现今日渐复杂的化合物结构,因为仿真软件的操作将花费大量时程且成功率偏低。

据此,如何有效地降低药物研发时程与经费是当前重要的课题。

发明内容

本发明提供一种药物筛选系统与药物筛选方法,借以有效地降低药物开发时程与经费。

本发明提供一种药物筛选系统,包括编码模块、候选药物生成模块与药物排序模块。编码模块对药物表达式与至少一药物排序指标进行编码,以产生第一编码变量。候选药物生成模块依据第一编码变量,训练生成对抗网络,以产生多个候选药物,其中每一候选药物具有生成药物表达式与至少一生成药物排序指标。药物排序模块依据每一候选药物的至少一生成药物排序指标,对候选药物的强度进行排序来筛选药物。

本发明提供一种药物筛选方法,包括下列步骤:对药物表达式与至少一药物排序指标进行编码,以产生第一编码变量。依据第一编码变量,训练生成对抗网络,以产生多个候选药物,其中每一候选药物具有生成药物表达式与至少一生成药物排序指标。依据每一候选药物的至少一生成药物排序指标,对候选药物的强度进行排序来筛选药物。

本发明所公开的药物筛选系统与药物筛选方法,通过对药物表达式与药物排序指标进行编码,以产生第一编码变量。依据第一编码变量,训练生成对抗网络,以产生多个候选药物,其中每一候选药物具有生成药物表达式与至少一生成药物排序指标。依据每一候选药物的生成药物排序指标,对候选药物的强度进行排序来筛选药物。如此一来,本发明实施例可以有效地降低药物开发的时程与经费,并加快开发流程。

附图说明

图1为依据本发明的一实施例的药物筛选系统的示意图;

图2为依据本发明的一实施例的编码变量的示意图;

图3为依据本发明的一实施例的计算药物结构分布的示意图;

图4为图1的候选药物生成模块的详细示意图;

图5为依据本发明的一实施例的药物筛选方法的流程图;

图6为图5的步骤S504的详细流程图。

【附图标记说明】

100:药物筛选系统

110:编码模块

120:候选药物生成模块

130:药物排序模块

140:显示模块

210,220:区域

310:化合物

410:编造药物生成模块

420:判断模块

S502~S508,S602~S612:步骤

具体实施方式

本说明书的技术用语参照本技术领域的习惯用语,如本说明书对部分用语有加以说明或定义,该部分用语的解释以本说明书的说明或定义为准。本发明的各个实施例分别具有一或多个技术特征。在可能实施的前提下,本技术领域普通技术人员可选择性地实施任一实施例中部分或全部的技术特征,或者选择性地将这些实施例中部分或全部的技术特征加以组合。

在以下所列举的各实施例中,将以相同的标号代表相同或相似的元件或组件。

图1为依据本发明的一实施例的药物筛选系统的示意图。请参考图1,药物筛选系统100包括编码模块110、候选药物生成模块120与药物排序模块130。

编码模块110对药物表达式与至少一药物排序指标进行编码,以产生第一编码变量200。在本实施例中,编码模块110可例如为编码器。第一编码变量例如为隐变量(latentvariable)且包括药物表达式与药物排序指标,如图2所示。在图2中,药物表达式编码于区域210中,且药物排序指标编码于接续区域210的区域220中。药物表达式与药物排序指标可以从已知化合物取得,例如通过活性测试(active assays)。

在一实施例中,药物表达式例如包括简化分子线性输入规范(simplifiedmolecular input line entry specification,SMILES)或化合物指纹(molecularfingerprint),但本发明不限于此。简化分子线性输入规范是一种用ASCII字符串明确描述分子结构的规范。也就是说,简化分子线性输入规范表示为一字符串(string),例如c1c(O)c1(NC(=O))。化合物指纹从简化分子线性输入规范提取重要结构特征。也就是说,化合物指纹表示为一向量(vector),例如[1,1,0,1,0,0..........]。药物表达式唯一对应到特定的化合物(particular compound),例如MCF-7(乳癌(Breast Cancer))的真实化合物或其他化合物。

另外,药物排序指标包括药物结构分布或药理特性。在一实施例中,药物结构分布可例如包括化合物的最近邻居(nearest neighbor)的数量。举例来说,如图3所示,计算每一化合物与邻居节点(node)之间的相似度。接着,基于化合物310,计算落在相似度门坎值(similarity threshold)K中的化合物的数量N。对化合物的数量N进行二值化(binarization)。如果N>0,则N的值设定为1。如图3所示,有6个化合物落在相似度门坎值K中,因此N的值为1。之后,N的值作为药物结构分布。在另一实施例中,药理特性例如包括IC50、GI等,但本发明不限于此。

候选药物生成模块120耦接编码模块110。在本实施例中,候选药物生成模块120可例如为微处理器(microprocessor)或微控制器(microcontroller),本发明不限于此。候选药物生成模块120依据第一编码变量,训练生成对抗网络(generative adversarialnetwork,GAN),以产生多个候选药物,其中每一候选药物具有生成药物表达式与至少一生成药物排序指标。在本实施例中,候选药物可例如为先导化合物(lead compound)。生成药物表达式例如分别包括简化分子线性输入规范(SMILES)或化合物指纹,但本发明不限于此。生成药物排序指标分别包括药物结构分布或药理特性。生成药物表达式与生成药物排序指标的说明可参考如上药物表达式与药物排序指标的说明,故在此不再赘述。

在候选药物生成模块120接收编码模块110所产生的第一编码变量后,候选药物生成模块120依据第一编码变量,训练生成对抗网络。举例来说,候选药物生成模块120可以依据多个随机值(random value),产生多个编造药物(fake drug)表达式与多个编造药物排序指标。在本实施例中,编造药物表达式与其编造药物排序指标彼此互不相同。编造药物表达式例如分别包括简化分子线性输入规范(SMILES)或化合物指纹,但本发明不限于此。编造药物排序指标分别包括药物结构分布或药理特性。编造药物表达式与编造药物排序指标的说明可参考如上药物表达式与药物排序指标的说明,故在此不再赘述。

接着,候选药物生成模块120会将编造药物表达式与编造药物排序指标传送至编码模块110。之后,编码模块110对编造药物表达式与编码药物排序指标进行编码,以产生多个第二编码变量。接着,编码模块110将第二编码变量传送至候选药物生成模块120。之后,候选药物生成模块120可以比较第一编码变量与第二编码变量,以产生多个判断值。上述判断值用于指示包括在第一编码变量中的药物表达式及药物排序指标与包括在第二编码变量中的编造药物表达式及编造药物排序指标之间的相似度程度。

接着,候选药物生成模块120可以判断上述判断值是否达到默认值。在本实施例中,上述判断值例如为50%,但本发明不限于此。当判断出上述判断值达到默认值时,表示此判断为收敛,并且包括在第二编码变量中的编造药物表达式及编码药物排序指标相似于包括在第一编码变量中的药物表达式与药物排序指标。接着,候选药物生成模块120可以依据对应于第二编码变量的编造药物表达式与编造药物排序指标,产生候选药物,其中生成药物表达式对应于编造药物表达式,且生成药物排序指标对应于编造药物排序指标。

当判断出上述判断值未达到默认值时,表示此判断不为收敛,并且包括在第二编码变量中的编造药物表达式及编造药物排序指标不相似于包括在第一编码变量中的药物表达式及药物排序指标。接着,候选药物生成模块120可以对编造药物表达式与编造药物排序指标进行更新。举例来说,候选药物生成模块120可以依据上述判断值修改编造药物表达式与编造药物排序指标,以便对编造药物表达式与编造药物排序指标进行更新。

接着,候选药物生成模块120可以再次将更新后的编造药物表达式及更新后的编造药物排序指标传送至编码模块110。之后,编码模块110对更新后的编造药物表达式及更新后的编造药物排序指标进行编码,以产生更新后的第二编码变量。接着,候选药物生成模块120可以比较第一编码变量与更新后的第二编码变量,以产生判断值。之后,候选药物生成模块120可以再次判断上述判断值是否达到默认值。接着,候选药物生成模块120可以重复执行上述方法,直到上述判断值达到默认值且候选药物生成模块120依据对应于第二编码变量的编造药物表达式与编造药物排序指标产生候选药物为止。

药物排序模块130耦接候选药物生成模块120。在本实施例中,药物排序模块130可例如为微处理器或微控制器,本发明不限于此。药物排序模块130依据每一候选药物的生成药物排序指标,对候选药物的强度进行排序来筛选药物。也就是说,当药物排序模块130接收到候选药物时,药物排序模块130可以从候选药物取得生成药物表达式与生成药物排序指标。

接着,药物排序模块130可以对候选药物的生成药物表达式与生成药物排序指标进行分析。举例来说,药物排序模块130可以依据生成药物排序指标,对候选药物的强度进行分析。接着,药物排序模块130会依据生成药物排序指标的强度,对候选药物的强度进行排序来筛选药物,并且产生候选药物的排序窗体。因此,本发明实施例可以有效地降低药物开发时程与经费,并加快药物开发流程。

此外,药物筛选系统100进一步包括显示模块140。在本实施例中,显示模块140可例如为显示器或监视器,但本发明不限于此。显示模块140耦接编码模块110、候选药物生成模块120与药物排序模块130。显示模块140通过图形用户界面(graphic user interface)显示第一编码变量、候选药物、生成药物表达式、生成药物排序指标与候选药物的强度。因此,用户可以快速地得知药物筛选系统100的操作与候选药物的产生,进而有效地降低药物开发的时程及经费,并加快开发流程。

图4为图1的候选药物生成模块的详细示意图。请参考图4。在本实施例中,候选药物生成模块120包括编造药物生成模块410与判断模块420。

编造药物生成模块410耦接编码模块110。编造药物生成模块410依据多个随机值(random value),产生多个编造药物表达式与编造药物排序指标。举例来说,编造药物生成模块410可以通过一个随机值,对应产生一个编造药物表达式与编造药物排序指标。也就是说,一个随机值会对应一个编造药物表达式与编造药物排序指标。编造药物生成模块410可以通过两个随机值,对应产生两个编造药物表达式与编造药物排序指标。也就是说,两个随机值会对应两个编造药物表达式与编造药物排序指标。编造药物生成模块410可以通过三个随机值,对应产生三个编造药物表达式与编造药物排序指标。也就是说,三个随机值会对应三个编造药物表达式与编造药物排序指标。其余则类推。另外,编造药物表达式与编造药物排序指标用于训练生成对抗网络。在本实施例中,上述随机值可例如由使用者预设。接着,编造药物生成模块410将编造药物表达式与编造药物排序指标传送至编码模块110。之后,编码模块110可以对编造药物表达式与编造药物排序指标进行编码,以产生第二编码变量。

判断模块420耦接编码模块110与编造药物生成模块410。判断模块420接收第一编码变量与第二编码变量,并比较第一编码变量与第二编码变量,以产生判断值。

在编造药物生成模块410接收到上述判断值之后,编造药物生成模块410可以判断上述判断值是否达到默认值。当判断出上述判断值达到默认值时,表示包括在第二编码变量中的编造药物表达式与编造药物排序指标相似于包括在第一编码变量中的药物表达式与药物排序指标。接着,编造药物生成模块410可以依据对应于第二编码变量的编造药物表达式与编造药物排序指标,产生候选药物,其中生成药物表达式对应于编造药物表达式,且生成药物排序指标对应于编造药物排序指标。

当判断出上述判断值未达到默认值时,表示包括在第二编码变量中的编造药物表达式与编造药物排序指标不相似于包括在第一编码变量中的药物表达式与编造药物排序指标。接着,编造药物生成模块410可以对编造药物表达式与编造药物排序指标进行更新。举例来说,编造药物生成模块410可以依据上述判断值,修改编造药物表达式与编造药物排序指标,以便对编造药物表达式与编造药物排序指标进行更新。

接着,编造药物生成模块410可以再次将更新后的编造药物表达式与更新后的编造药物排序指标传送至编码模块110。之后,编码模块110对更新后的编造药物表达式与更新后的编造药物排序指标进行更新,以产生更新后的第二编码变量。接着,判断模块420可以再次比较第一编码变量与更新后的第二编码变量,以产生判断值。上述判断值可以传送至编造药物生成模块410。之后,编造药物生成模块410可以再次判断上述判断值是否达到默认值。接着,编造药物生成模块410与判断模块420可以重复上述方法,直到上述判断值达到默认值且编造药物生成模块410依据编造药物表达式与编造药物排序指标产生候选药物为止。

此外,编造药物生成模块410与判断模块420耦接显示模块140。据此,显示模块140可进一步通过图形用户界面显示编造药物表达式、编造药物排序指标、第二编码变量、上述判断值与比较结果。因此,用户可以快速地得知药物筛选系统的操作及候选药物的产生,进而有效地降低药物开发的时程及经费,并加快开发流程。

通过如上实施例的说明,本发明实施例提供一种药物筛选方法。图5为依据本发明的一实施例的药物筛选方法的流程图。

在步骤S502中,对药物表达式与至少一药物排序指标进行编码,以产生第一编码变量。在步骤S504中,依据第一编码变量,训练生成对抗网络,以产生多个候选药物,其中每一候选药物具有生成药物表达式与至少一生成药物排序指标。

在步骤S506中,依据每一候选药物的至少一生成药物排序指标,对候选药物的强度进行排序来筛选药物。在步骤S508中,显示第一编码变量、候选药物、生成药物表达式、生成药物排序指标与候选药物的强度。在本实施例中,药物表达式与生成药物表达式分别包括简化分子线性输入规范(SMILES)或化合物指纹,但本发明不限于此。另外,药物排序指标与生成药物排序指标分别包括药物结构分布或药理特性。药物结构分布包括化合物的最近邻居的数量,且药理特性包括IC50、GI,但本发明不限于此。此外,药物表达式唯一对应到特定的化合物(particular compound)。

图6为图5的步骤S504的详细流程图。在步骤S602中,依据多个随机值,产生多个编造药物表达式与多个编造药物排序指标。在步骤S604中,对编造药物表达式与编造药物排序指标进行编码,以产生多个第二编码变量。

在步骤S606中,接收第一编码变量与第二编码变量,并比较第一编码变量与第二编码变量以产生多个判断值。

在步骤S608中,判断判断值是否达到默认值。当判断出判断值到达默认值时,进入步骤S610,依据对应于第二编码变量的编造药物表达式与编造药物排序指标,产生候选药物。

当判断出判断值未达到默认值时,进入步骤612,对编造药物表达式与编造药物排序指标进行更新。接着,在执行步骤S612后,上述方法进入步骤S606,再次比较药物表达式及药物排序指标与更新后的编造药物表达式及更新后的编造药物排序指标,以产生判断值。在本实施例中,编造药物表达式分别包简化分子线性输入规范(SMILES)或化合物指纹,但本发明不限于此。另外,编造药物排序指标分别包括药物结构分布或药理特性。药物结构分布包括化合物的最近邻居的数量,且药理特性包括IC50、GI,但本发明不限于此。

综上所述,本发明所公开的药物筛选系统与药物筛选方法,通过对药物表达式与药物排序指标进行编码,以产生第一编码变量。依据第一编码变量,训练生成对抗网络,以产生多个候选药物,其中每一候选药物具有生成药物表达式与至少一生成药物排序指标。依据每一候选药物的生成药物排序指标,对候选药物的强度进行排序来筛选药物。如此一来,本发明实施例可以有效地降低药物开发的时程与经费,并加快开发流程。

本发明虽以实施例公开如上,但其并非用以限定本发明的范围,任何所属技术领域中普通技术人员,在不脱离本发明的精神和范围内,当可做些许的更动与润饰,因此本发明的保护范围当视权利要求书所界定者为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号