首页> 中国专利> 基于双向长短记忆模型的药物小分子活性预测的方法和系统

基于双向长短记忆模型的药物小分子活性预测的方法和系统

摘要

本发明公开了一种基于双向长短记忆模型的药物小分子活性预测的方法,包括:获取数据集;对所述数据集进行预处理,包括将所述数据集中的所有化合物分子用SMILES表示,对所有分子的SMILES表达式做标准化处理,统一分子SMILES表达式中的原子、键、连接关系的编码方式和顺序,利用分子的InChIKey,进行去重复化处理;对预处理的数据集进行编码,其中通过独热编码对SMILES序列的单个元素、单个数字、单个符号以及整个方括号看作一个序列令牌,每个令牌本身具有化学意义和指向性,任何令牌的组合符合化学规则;构建双向长短记忆核心片段识别模型;将编码数据输入所述双向长短记忆核心片段识别模型,得到隐藏状态矩;以及对上述双向长短记忆核心片段识别模型进行评估。

著录项

  • 公开/公告号CN111640471A

    专利类型发明专利

  • 公开/公告日2020-09-08

    原文格式PDF

  • 申请/专利权人 牛张明;韦德·门佩斯-史密斯;

    申请/专利号CN202010464590.9

  • 发明设计人 牛张明;韦德·门佩斯-史密斯;

    申请日2020-05-27

  • 分类号G16C20/30(20190101);G16C20/70(20190101);G16B15/30(20190101);G16B40/00(20190101);G06F40/284(20200101);G06F40/30(20200101);

  • 代理机构31313 上海智晟知识产权代理事务所(特殊普通合伙);

  • 代理人张东梅

  • 地址 浙江省杭州市钱塘新区新加坡科技园15幢11楼

  • 入库时间 2023-06-19 08:12:49

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号