首页> 中文学位 >有机物的结构与粘度等安全参数的定量构效关系模型研究
【6h】

有机物的结构与粘度等安全参数的定量构效关系模型研究

代理获取

目录

摘要

图表目录

1 绪论

1.1 研究背景

1.2 国内外研究进展

1.2.1 粘度预测方法的研究进展

1.2.2 热容预测方法的研究进展

1.2.3 热导率预测方法的研究进展

1.2.4 自燃点预测方法的研究进展

1.3 本文的主要研究内容

2 QSPR研究的基本理论

2.1 分子描述符

2.1.1 分子描述符种类

2.1.2 分子描述符的计算

2.2 训练集和测试集的划分

2.3 分子描述符的筛选与建模

2.3.1 分子描述符筛选方法

2.3.2 QSPR中的建模方法

2.4 模型的评价验证

2.5 模型应用域的评价与验证

2.6 小结

3 QSPR主要研究方法

3.1 ISODATA算法简介

3.1.1 ISODATA算法的基本原理

3.1.2 ISODATA算法的实现

3.2 蚁群算法的基本原理

3.2.1 蚁群算法的简介

3.2.2 目标函数的选择

3.2.3 蚁群算法的实现

3.3 遗传算法的基本原理

3.3.1 遗传算法简介

3.3.2 函数的选择

3.3.3 遗传算法的实现

3.4 支持向量机的基本原理

3.4.1 理论背景

3.4.2 支持向量机回归算法

3.4.3 参数优化

3.4.4 算法的实现

3.5 小结

4 有机物粘度的QSPR预测研究

4.1 引言

4.2 实验过程

4.2.1 样本说明

4.2.2 分子描述符的计算与预筛选

4.2.3 样本集的划分

4.2.4 分子描述符的筛选与建模

4.3 结果与讨论

4.3.1 GA-MLR粘度预测模型

4.3.2 GA-SVM粘度预测模型

4.3.3 ACO-MLR粘度预测模型

4.3.4 ACO-SVM粘度预测模型

4.3.5 模型性能及应用域评价

4.3.6 模型的比较

4.4 小结

5 有机物热容的QSPR预测研究

5.1 引言

5.2 实验过程

5.2.1 样本说明

5.2.2 分子描述符的计算与预筛选

5.2.3 样本集的划分

5.2.4 分子描述符的筛选与建模

5.3 结果与讨论

5.3.1 GA-MLR热容预测模型

5.3.2 GA-SVM热容预测模型

5.3.3 ACO-MLR热容预测模型

5.3.4 ACO-SVM热容预测模型

5.3.5 模型性能及应用域评价

5.3.6 模型的比较

5.4 小结

6 有机物热导率的QSPR预测研究

6.1 引言

6.2 实验过程

6.2.1 样本说明

6.2.2 分子描述符的计算与预筛选

6.2.3 样本集的划分

6.2.4 分子描述符的筛选与建模

6.3 结果与讨论

6.3.1 GA-MLR热导率预测模型

6.3.2 GA-SVM热导率预测模型

6.3.3 ACO-MLR热导率预测模型

6.3.4 ACO-SVM热导率预测模型

6.3.5 模型性能及应用域评价

6.3.6 模型的比较

6.4 小结

7 有机物自燃点的QSPR预测研究

7.1 引言

7.2 实验过程

7.2.1 样本说明

7.2.2 分子描述符的计算与预筛选

7.2.3 样本集的划分

7.2.4 分子描述符的筛选与建模

7.3 结果与讨论

7.3.1 GA-MLR自燃点预测模型

7.3.2 GA-SVM自燃点预测模型

7.3.3 ACO-MLR自燃点预测模型

7.3.4 ACO-SVM自燃点预测模型

7.3.5 模型性能及应用域评价

7.3.6 模型的比较

7.4 小结

8 结论

8.1 结论

8.2 创新点

8.3 展望

致谢

参考文献

附录A

攻读博士学位期间发表的论文情况

攻读博士学位期间参加的科学研究情况

附录C

展开▼

摘要

热安全在化工生产安全中占有极其重要的地位。本论文选择粘度、热容、热导率和自燃点这四个安全参数进行预测研究,对生产安全有着重要的理论意义和实用价值。基于QSPR(Quantitative Structure-Property Relationship)基本原理,构建了有机物粘度、热容、热导率、自燃点与其分子结构间的QSPR预测模型,探究影响其性质的结构因素。主要研究方法与结论如下:
  (1)采用Dragon2.1软件计算化合物的分子描述符,以迭代自组织数据分析技术(Iterative Self-Organizing Data Analysis Techniques Algorithm,ISODATA)将样本集初步分类,随后在各个类别中随机选取样本作为训练集用于建立模型。分别运用遗传算法(Genetic Algorithm,GA)和蚁群算法(Ant Colony Optimization,ACO)获取特征描述符,并分析了特征描述符与其性质间的关系。将特征描述符作为模型的输入参数,分别与多元线性回归(Multiple Linear Regression,MLR)法和支持向量机(Support VectorMachine,SVM)法结合建立了GA-MLR、GA-SVM、ACO-MLR和ACO-SVM模型。采用模型评价参数对所建模型性能进行了全面的评价验证,应用Williams图对模型的应用域进行了研究,找出了标准残差和臂比值超出界定范围的化合物,并分析了出现“异常值”的原因。将所建预测模型与文献中已有模型进行比较,发现所建模型优于文献中已有模型。
  (2)对有机物粘度与其分子结构间的QSPR研究结果如下:ISODATA算法将310种化合物分成11类,选取248种化合物作为训练集建立粘度预测模型。GA和ACO筛选出的特征描述符均认为化合物的粘度值大小主要由化合物的溶解熵大小以及分子中亲水基团的数目所决定,且GA筛选出的nOH描述符明确指出是亲水基团中的羟基数目。所建立的四个粘度预测模型决定系数R2均在0.75以上,预测效果令人满意。其中,GA-MLR模型优于ACO-MLR模型,GA-SVM模型优于ACO-SVM模型,GA-MLR模型和GA-SVM模型的R2达到0.9左右,表明GA筛选出了对粘度有较大影响的特征结构。
  (3)采用相似的方法对有机物的热容进行了QSPR研究,结果如下:ISODATA算法将650种化合物分成16类,520种化合物作为训练集。由GA和ACO均获得5个特征描述符,且获得了一个对热容贡献度最大的相同特征描述符即S1K,该描述符主要反映杂化原子以及杂化状态对分子形状的影响程度。所建热容预测模型非常优秀,其R2均在0.90以上。通过模型的比较发现,GA-MLR模型优于ACO-MLR模型,GA-SVM模型优于ACO-SVM模型,GA-MLR模型和GA-SVM模型的R2达到0.95以上,预测结果非常满意。
  (4)同样地,对有机物热导率进行了QSPR研究。结果为:ISODATA算法将178种化合物分成10类,142种化合物作为训练集。GA筛选出的特征描述符主要反映分子中氟原子的数目、分子的极化率、原子对以及整个分子中的电荷转换、原子范德华体积大小等,以特征描述符作为输入参数,建立了GA-MLR和GA-SVM模型,其预测结果比较令人满意,R2均在0.70以上,且后者优于前者,说明SVM是一种可以快速、有效、准确预测有机物热导率的工具。
  (5)对有机物自燃点进行QSPR研究结果如下:ISODATA算法将265种化合物分成5类,212种化合物作为训练集。由GA获得的特征描述符主要反映分子大小、分子中支链数目、整个分子中原子的立体空间结构等,以其作为模型输入参数获得GA-MLR和GA-SVM模型,其R2均在0.75以上,结果比较理想。由ACO获得的特征描述符所建的ACO-SVM模型预测效果令人满意,训练集和测试集的R2均在0.80以上,表明ACO获得的特征描述符与自燃点之间存在较强的非线性关系。此外,GA-SVM和ACO-SVM模型均优于GA-MLR模型,表明分子结构与自燃点之间存在较强的非线性关系。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号