首页> 美国卫生研究院文献>Bioinformation >An alphabetic code based atomic level molecular similarity search in databases
【2h】

An alphabetic code based atomic level molecular similarity search in databases

机译:数据库中基于字母代码的原子级分子相似性搜索

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Atomic level molecular similarity and diversity studies have gained considerable importance through their wide application in Bioinformatics and Chemo-informatics for drug design. The availability of large volumes of data on chemical compounds requires new methodologies for efficient and effective searching of its archives in less time with optimal computational power. We describe an alphabetic algorithm for similarity searching based on atom-atom bonding preference for ligands. We represented 170 cyclindependent kinase 2 inhibitors using strings of pre-defined alphabets for searching using known protein sequence alignment tools. Thus, a common pattern was extracted using this set of compounds for database searching to retrieve similar active compounds. Area under the receiver operating characteristic (ROC) curve was used for the discrimination of similar and dissimilar compounds in the databases. An average retrieval rate of about 60% is obtained in cross-validation using the home-grown dataset and the directory of useful decoys (DUD, formally known as the ZINC database) data. This will help in the effective retrieval of similar compounds using database search.
机译:原子水平的分子相似性和多样性研究由于在药物设计的生物信息学和化学信息学中得到广泛应用而变得相当重要。要获得大量有关化合物的数据,就需要新的方法,以更短的时间以最佳的计算能力高效,有效地搜索其档案。我们描述了一种基于原子-原子键合配体的相似性搜索的字母算法。我们使用预先定义的字母字符串表示170种细胞周期蛋白依赖性激酶2抑制剂,以使用已知的蛋白质序列比对工具进行搜索。因此,使用这组化合物提取了通用模式,用于数据库搜索以检索相似的活性化合物。接收器工作特性(ROC)曲线下方的区域用于区分数据库中相似和不相似的化合物。使用本地数据集和有用诱饵目录(DUD,正式称为ZINC数据库)数据进行交叉验证时,平均检索率约为60%。这将有助于使用数据库搜索有效检索相似的化合物。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号