首页> 中文学位 >多元校正与定量结构活性相关性研究中新型化学计量学算法研究
【6h】

多元校正与定量结构活性相关性研究中新型化学计量学算法研究

代理获取

目录

文摘

英文文摘

声明

第1章绪论

1.1多元校正

1.2定量构效关系研究

1.3推进(boosting)

1.4粒子群算法

1.5人工神经网络

1.6支持向量机

1.7分类与回归树(classification and regression trees,CART)

1.8本论文的研究工作

第2章基于镱为内标的近红外光谱干膜法结合推进支持向量回归的血糖测定研究

2.1前言

2.2理论

2.2.1基于内标的干膜厚度校正

2.2.2支持向量回归

2.2.3推进支持向量回归

2.3实验

2.3.1仪器和试剂

2.3.2样品的制备

2.3.3 NIR光谱数据的获得

2.4结果与讨论

2.4.1基于内标的干膜法

2.4.2参数选择

2.4.3近红外的数据分析

2.5小结

第3章傅立叶变换-红外光谱干膜法结合推进支持向量回归用于测定血浆中葡萄糖

3.1前言

3.2 理论

3.2.1推进支持向量回归(见2.2.3)

3.3实验

3.3.1仪器和试剂

3.3.2样品制备

3.3.3光谱量测

3.4结果与讨论

3.4.1 IR光谱数据分析

3.4.2参数优化

3.5小结

第4章推进支持向量回归法用于定量构效关系研究

4.1前言

4.2理论

4.2.1推进支持向量回归(见2.2.3)

4.3数据集

4.3.1硝基苯化合物

4.3.2 5-脂氧合酶抑制剂数据

4.4结果与讨论

4.4.1硝基苯化合物数据

4.4.2 5-脂氧合酶抑制剂数据

4.5小结

第5章稳健推进偏最小二乘回归用于血管紧缩素Ⅱ抑制剂的定量构效关系研究

5.1前言

5.2理论

5.2.1 F-统计用于自动确定PLS隐变量个数

5.2.2稳健推进偏最小二乘

5.3数据集

5.4结果与讨论

5.5小结

第6章杂交粒子群算法用于自适应构建径向基函数网络

6.1前言

6.2理论

6.2.1径向基函数网络

6.2.2粒子群优化算法

6.2.3改进的离散粒子群优化算法

6.2.4杂交粒子群算法用于自适应构建径向基函数网络(HPSORBFN)

6.2.5目标函数

6.3数据集

6.3.1数据集1

6.3.2数据集2

6.4结果与讨论

6.4.1数据集1

6.4.2数据集2

6.5小结

第7章粒子群优化算法用于训练基于径向基函数网络变换的非线性支持向量机及其QSAR研究应用

7.1前言

7.2理论

7.2.1支持向量机(SVM)回归

7.2.2基于径向基函数网络变换的非线性支持向量机(RBFN-SVM)

7.3数据集

7.3.1艾滋病病毒逆转录酶(HIV-1 RT)抑制剂数据集

7.3.2血小板源性生长因子受体(PDGFR)抑制剂数据集

7.4结果与讨论

7.4.1 HIV-1 RT数据集

7.4.2 PDGFR抑制剂数据集

7.5小结

第8章基于神经网络转换的非线性偏最小二乘回归用于定量构效关系研究

8.1前言

8.2理论

8.2.1基于神经网络转换的非线性偏最小二乘回归

8.2.2粒子群优化(PSO)算法及F-统计

8.3数据集

8.3.1模拟数据

8.3.2数据集2

8.3.3数据集3

8.4结果与讨论

8.4.1模拟数据

8.4.2数据集2

8.4.3数据集3

8.5小结

第9章改进的离散粒子群算法用于自适应构建全局最优的分类与回归树

9.1前言

9.2理论

9.2.1分类与回归树

9.2.2改进的离散粒子群优化算法

9.2.3改进的离散粒子群算法用于自适应构建分类与回归树

9.2.4目标函数

9.3数据集

9.3.1类黄酮衍生物作为p561ck酪氨酸激酶抑制剂数据

9.3.2表皮生长因子受体(EGFR)酪氨酸酶抑制剂数据

9.4结果与讨论

9.4.1类黄酮衍生物作为p561ck酪氨酸激酶抑制剂数据

9.4.2表皮生长因子受体(EGFR)酪氨酸酶抑制剂数据

9.5 小结

结论

参考文献

致谢

附录

展开▼

摘要

本文作者对多元校正和定量结构活性相关性研究这两个领域中的一些难点问题进行了深入的研究,提出了多种新型的化学计量学算法,并将其应用于实际体系的研究。本论文的内容主要涉及到以下几个方面: 1.设计了一种基于镱为内标的近红外光谱干膜法结合推进支持向量回归来进行血糖分析。稀土元素镱被用作内标以解决干膜制备过程中各个干膜厚度不一的难题。推进支持向量回归法通过组合支持向量回归和推进算法而得到。其基本思想为通过迭代逐步地构建出一组支持向量回归模型,每一个支持向量回归模型都着重弥补前一个支持向量回归模型的缺陷,最后组合所有的支持向量回归模型的结果,以获得最终的预测结果。结果表明通过使用近红外光谱内标干膜法结合推进支持向量回归建模,水吸收的干扰能被很好的消除,血浆中的葡萄糖浓度能够被准确的测出,且样品用量少(仅50μL)。另外,推进技术明显提高了单个支持向量回归模型的性能,与传统的支持向量回归法和偏最小二乘法相比,推进支持向量回归法能提供更好的性能。因此,近红外光谱内标干膜法结合推进支持向量回归法,将有望于成为新的有效的血糖分析工具,并可用于生物流体中其它具有临床意义的分析物的近红外光谱分析。 2.结合红外光谱内标干膜法与推进支持向量回归用于血糖分析。硫氰酸钾为干膜法中的内标。同时,移动窗口偏最小二乘回归被用来选择有效的波数区间以用于多变量建模。红外光谱内标干膜法结合推进支持向量回归能有效地克服水吸收给血糖测量带来的干扰,在理想的精度范围内测定血糖,且样品需求体积少(仅5μL)。同时,我们也将推进支持向量回归法与传统的偏最小二乘法和支持向量回归法进行了性能比较。结果证明,推进支持向量回归为一种有效的多元校正方法,其性能要明显优于传统的支持向量回归法和偏最小二乘法。 3.应用推进支持向量回归法对一系列硝基苯化合物和1-苯基[2氢]-4氢-3嗪-3-氢衍生物作为5-脂氧合酶抑制剂进行了定量构效关系研究。结果表明,推进支持向量回归的性能要明显优于多元线性回归法和支持向量回归法,是定量构效关系研究中的一种有效的建模方法,可以作为一种补充性工具,为新药研制提供了一条捷径。 4.提出了一种稳健版本的推进技术,并将其用于提高偏最小二乘法的性能,即稳健推进偏最小二乘。该算法的基本思想为:通过在迭代过程中引入一个误差修剪策略来建立一系列稳健的偏最小二乘模型,最后组合所有的偏最小二乘模型的结果,以获得最终的预测结果。其中,F-统计被用来自动确定偏最小二乘模型的维数。我们将提出的算法用于预测4氢-1,2,4-三唑类化合物对血管紧缩素Ⅱ的拮抗活性,获得了满意的结果。 5.分析了传统的径向基函数网络构建方法引起网络过拟合和局部最优的原因,将杂交的粒子群优化算法用于自适应构建径向基函数网络。连续的粒子群优化算法用来训练网络参数(包括中心,宽度和权重),而改进的离散粒子群优化算法用于确定适宜的网络结构(隐节点个数),两种版本的粒子群优化算法相结合来搜索全局最优的网络结构和参数。为了增加网络的灵活性和减少输入变量的过分的可变性,椭圆径向基函数被用来作为径向基函数网络中的基函数。我们还提出了一个新的拟合函数来确定最佳的网络结构和参数。我们用所提出的径向基函数网络构建方法来预测二[(吖啶-4-羧基酰胺)丙基]甲胺衍生物对老鼠P388白血病细胞的抑制活性和环氧酶抑制剂的生物活性,并与固定网络结构,用粒子群优化算法和K-均值方法结合规整化方法仅训练网络参数的结果作了比较,结果表明杂交的粒子群算法能有效的训练网络,快速地收敛于最优解,所构建的网络能在一定程度上避免了过拟合和局部最优现象的产生。 6.提出了一种的基于径向基函数网络转换的全局最优的非线性支持向量机算法。该算法通过一个只有一个输入层和一个隐含层的径向基函数网络实现原始变量到特征空间的非线性变换。该变换本质上是实现了原始变量的核变换。用粒子群优化算法协同优化所有参数包括核中心、核宽度以及支持向量机中系数使得按照全模型的性能作出灵活的核变换成为可能。对艾滋病毒1型逆转录酶抑制剂与1-苯基苯并咪唑活性的定量构效关系研究结果表明,所提出的算法性能相当稳定,且要优于反向传播神经网络以及传统的非线性支持向量机。 7.结合了偏最小二乘法能克服共线性问题和神经网络能拟合强的非线性关系的优点,提出了一种优化的非线性版本的偏最小二乘算法。这种算法首先用神经网络中非线性映射将化合物的描述符转化成隐含层的输出,然后用偏最小二乘回归来关联隐含层的输出和化合物的生物活性,粒子群优化算法以模型误差为目标函数被用于优化输入层和隐含层之间的权重以获得一个满意的非线性版本的偏最小二乘模型。非线性偏最小二乘法既能很好的拟合数据中的非线性关系又能有效的抑制过拟合现象的产生,为复杂数据解析提供了有效的新工具。 8.为克服传统方法构建的分类与回归树中存在的过拟合和局部最优等问题,引入了改进的离散粒子群算法来自适应构建分类与回归树,即同时搜索每个分枝节点中最优的分枝变量和分枝值以及合适的树结构(即:树的复杂性)。该方法集树的生长、修剪于一体,并不需要选择子树。另外,我们还提出了一个新的目标函数来确定合适的树的复杂性和最优的分枝变量及相应的分枝值。将所提出的分类与回归树构建方法用于预测类黄酮衍生物的生物活性和表皮生长因子受体酪氨酸酶抑制剂的抑制活性,结果表明,改进的离散粒子群算法为一种有效的分类与回归树构建方法,快速地收敛到最优解,所构建的分类与回归树能在很大程度上避免了过拟合问题的产生,由改进的离散粒子群算法构建的分类与回归树要优于传统方法所构建的树。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号