首页> 中文学位 >基因表达式编程与支持向量机在疾病诊断和QSAR/QSPR中的应用研究
【6h】

基因表达式编程与支持向量机在疾病诊断和QSAR/QSPR中的应用研究

代理获取

目录

文摘

英文文摘

原创性声明及关于学位论文使用授权的声明

论文创新之处

第一章基因表达编程算法和支持向量机方法基本原理及其应用进展

第二章基因表达编程与支持向量机在疾病诊断中的应用研究

第三章基于基因表达式编程和支持向量机方法的药物的QSAR研究

第四章基因表达式编程和支持向量机方法在化学中的应用研究

附录Ⅰ在读博士学位期间发表和待发表论文目录

附录Ⅱ作者简介

致 谢

展开▼

摘要

人工智能的发展对科技和经济的发展起了重大的推动作用。尤其在解决复杂优化、减少反应时间和促进产品的开发等方面表现更为突出。随着科技的进步,大量数据的产生需要有效的方法才能得出更加可行的结果,有利于促进科技的快速发展。因此研究新的高效数据挖掘方法和寻找规律已成为人工智能研究的迫切需要。 本文对一种新的数据挖掘方法:基因表达式编程(geneexpressionprogramming,GEP)进行研究,GEP是一种新的机器学习算法,具有优异的泛化能力,是由FerreiraC.于1999年根据遗传算法和遗传程序发展而来的。本论文主要对GEP的原理和在定量结构—性质/活性关系(QSPR/QSAR)和疾病诊断方面的进行了应用研究。 第一章:对GEP算法原理、实现步骤以及研究现状进行了详细的综述,并对GEP和支持向量机(supportvectormachines,SVM)在疾病诊断和QSAR中的应用现状进行了综述。 第二章:应用GEP和SVM方法对疾病的诊断和发病率进行预测,包括:(1)用SVM方法对346例(冠心病172例,健康体检174例)进行了分类判别,同时用线性判别分析方法(lineardiscriminantanalysis,LDA)作为对照研究,对训练集的预测准确率分别是96.86%和78.18%,测试组的预测准确率分别是90.57%和72.73%;(2)用SVM和LDA算法对70例(肾病综合征50例,肾小球肾炎20例)进行了诊断,训练集的预测准确率分别是94.6%和89.86%,测试组的预测准确率分别是78.18%和72.73%。表明用SVM方法建立的模型其预测能力要优于LDA;(3)用GEP方法对2003年我国SARS的高发地区北京市和山西省的发病趋势进行建模预测,其拟合情况与当时SRAS实际发病和死亡情况基本一致,实验结果表明其在精度和速度上都优于神经网络算法。 第三章:GEP和SVM方法在药物性质方面的应用研究:(1)应用启发式方法(HM)和支持向量机方法建立了70种药物与血浆蛋白结合率的定量构效关系模型,研究了分子结构对药物与血浆蛋白结合率的影响。两种方法均得到了较好的结果,交互检验的相关系数平方(R2)分别为0.80和0.82;通过对模型的稳定性和预测能力比较表明,支持向量机建立的QSAR模型能够更好地预测药物与血浆蛋白结合率;(2)应用GEP方法建立了抗艾滋病药物核苷类的定量构效关系模型,研究了分子结构对此类药物EC50的影响。用HM方法筛选5个描述符建立模型,平均误差是0.41,而模型的相关系数(R)是091,对GEP和SVM方法建立的模型进行了比较,GEP建立的模型中训练集和测试集的相关系数分别是0.91和0.63,而SVM方法建立的模型中训练集和测试集的相关系数分别是0.86和052,不论是测试集还是训练集的预测结果,GEP都优于SVM,因此GEP可以作为一种有效的手段预测核苷类的抗艾滋病药物的EC50;(3)基于GEP方法建立1,4-二氢吡啶钙离子通道拮抗剂的半数有效抑制浓度(IC50),用启发式方法筛选6个相关描述符,用GEP建立QSAR模型,得到了很好的预测结果,均方误差(MSE)是0.19,R2是0.92,本文为药物筛选和设计提供了一种新而有效的方法。 第四章:GEP和SVM方法在分析化学方面的研究应用:(1)建立了基于启发式方法和支持向量机方法的QSAR模型,用于预测α-环糊精与单取代或1,4-二取代苯衍生物结合后包结物的稳定常数。通过计算并用HM筛选6个参数,用于启发式方法和支持向量机方法建立QSAR模型,其R值分别是094和0.98,留一法(leave-one-out,LOO)交互检验的相关系数(RCV)分别为0.92和0.95。因此,用支持向量机方法建立的模型要优于启发式方法,其预测能力更强,模型的稳定性更好;(2)应用启发式方法和支持向量机方法建立了88种醛类化合物对大鼠急性毒性的定量构效关系模型,研究了醛类化合物分子结构对大鼠急性毒性的影响。两种方法均得到了较好的结果,启发式方法和支持向量机方法的交互检验的相关系数分别为0.90和0.93;通过对模型的稳定性和预测能力比较,支持向量机建立的QSAR模型能够更好地预测醛类化合物对大鼠的急性毒性LD50;(3)GEP作为一种新的机器学习方法,首次用来建立分子印迹聚合物的QSPR模型预测其容量因子,用启发式方法选取5个描述符建立模型,预测结果比较满意,同时用SVM方法和HM方法建立模型,经比较发现,GEP建立的模型有更好的预测能力和较低误差。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号