首页> 外文期刊>Journal of Mathematical Chemistry >Monte Carlo method for identification of outlier molecules in QSAR studies
【24h】

Monte Carlo method for identification of outlier molecules in QSAR studies

机译:QSAR研究中用于识别异常分子的蒙特卡洛方法

获取原文
获取原文并翻译 | 示例
       

摘要

The paper presents some difficulties that appear in the application of the classical formula in the identification of “outliers” in a given objects set. The paper proposes a new Monte Carlo-like method for the identification of “outliers” in the calibration set used in QSPR/QSAR computations. Sub-sets of molecules are randomly extracted thousands of times from the given calibration set. The method relies on the idea that the presence of “outlier” molecules in a certain sub-set decreases the prediction power of the QSAR equation that used this particular sub-set of molecules. The presence of “outlier” molecules often leads to poor quality QSAR equations and rarely to high quality QSAR equations. The paper proposes a specific formula for “outlier index”. The molecule with the highest value of the outlier index is eliminated out of the calibration set. The identification/elimination process is repeated until the maximum value of the outlier index stops decreasing. The paper presents five examples of outliers’ identification using various kinds of calibration sets. We compare the results with the results obtained by a classical outlier index formula, using the same calibration set, the same set of descriptors and the same outlier identification/elimination procedure. Keywords Monte Carlo - Outliers - Qsar
机译:本文提出了在应用经典公式来识别给定对象集中的“异常值”时出现的一些困难。本文提出了一种新的类似于蒙特卡洛的方法,用于识别QSPR / QSAR计算中使用的校准集中的“异常值”。从给定的校准集中随机提取分子子集数千次。该方法依赖于这样的想法,即在某个子集中存在“异常”分子会降低使用该分子子集的QSAR方程的预测能力。 “离群”分子的存在通常会导致质量差的QSAR方程,而很少导致高质量的QSAR方程。本文提出了“离群指数”的具体公式。具有离群指数最高值的分子将从校准集中消除。重复识别/消除过程,直到离群指标的最大值停止减小为止。本文介绍了使用各种校准集识别异常值的五个示例。我们将结果与通过使用相同的校准集,相同的描述符集和相同的异常值识别/消除过程的经典异常值索引公式获得的结果进行比较。蒙特卡罗-离群值-Qsar

著录项

  • 来源
    《Journal of Mathematical Chemistry》 |2010年第1期|p.174-190|共17页
  • 作者

    Tarko Laszlo;

  • 作者单位
  • 收录信息 美国《科学引文索引》(SCI);美国《生物学医学文摘》(MEDLINE);
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

    Monte Carlo; Outliers; Qsar;

    机译:蒙特卡洛;离群值;卡萨尔;
  • 入库时间 2022-08-18 02:17:21

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号