首页> 中国专利> 一种预测大气中有机胺促进甲磺酸驱动新粒子生成潜力的线性回归方法

一种预测大气中有机胺促进甲磺酸驱动新粒子生成潜力的线性回归方法

摘要

本发明为一种预测大气中有机胺促进甲磺酸驱动新粒子生成潜力的线性回归方法,构建过程如下:大气中有机胺种类的搜集及其气相碱性GB的查找;有机胺结构的优化;有机胺与甲磺酸1:1团簇形成自由能的计算;有机胺分子描述符平均第一电离势Mi,径向分布函数RDF040s的计算;多元线性回归模型训练;选用计算值‑预测值决定系数等指标对模型性能进行评价;表征模型应用域。本发明建立的预测模型具有良好的拟合能力、稳健性和预测能力,能够有效预测应用域内有机胺与甲磺酸1:1团簇的形成自由能,即有机胺促进甲磺酸新粒子生成的潜力,该方法简便高效、成本低,可节省实验测试的资源投入,为大气颗粒物前体物质的筛查,对空气质量预测和管理具有重要意义。

著录项

  • 公开/公告号CN115527623A

    专利类型发明专利

  • 公开/公告日2022-12-27

    原文格式PDF

  • 申请/专利权人 大连理工大学;

    申请/专利号CN202210275380.4

  • 发明设计人 谢宏彬;刘雨;马芳芳;

    申请日2022-03-21

  • 分类号G16C20/30(2019.01);G16C20/70(2019.01);G06K9/62(2022.01);G06F17/18(2006.01);

  • 代理机构大连格智知识产权代理有限公司 21238;大连格智知识产权代理有限公司 21238;

  • 代理人潘小铁;刘琦

  • 地址 116024 辽宁省大连市甘井子区凌工路2号

  • 入库时间 2023-06-19 18:14:35

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-01-13

    实质审查的生效 IPC(主分类):G16C20/30 专利申请号:2022102753804 申请日:20220321

    实质审查的生效

  • 2022-12-27

    公开

    发明专利申请公布

说明书

技术领域

本发明属于大气颗粒物来源及成因技术领域,涉及一种预测大气中有机胺促进甲磺酸驱动新粒子生成潜力的线性回归方法,具体为一种基于定量构效关系(QSAR)模型预测大气中有机胺促进甲磺酸新粒子生成潜力的方法。

背景技术

新粒子生成过程形成的二次颗粒物是大气颗粒物的重要来源,贡献颗粒物总粒子数的一半以上,是大气颗粒物污染研究的核心内容之一。甲磺酸驱动的新粒子生成过程对大气颗粒物的形成具有较大的贡献,有机胺作为大气中重要的有机碱可能通过酸-碱反应促进甲磺酸驱动的新粒子生成。甲磺酸具有广泛的来源,主要来自于大气中含硫有机化合物(OSCs)的氧化,其中海洋生物过程排放的二甲基硫(DMS)是最主要的前体物。除了海洋源,近期的研究发现内陆地区的农业、工业和养殖业也能排放类似的OSCs。有机胺是大气中一类重要的有机碱,其来源十分广泛,人为源包括畜牧养殖业、食品加工业、化工和皮革制造业、堆肥操作和发动机运行都能向大气中排放大量的有机胺。有机胺其他的人为源还包括下水道、烹饪、杀虫剂等。有机胺的自然源包括海洋生物活动、生物质燃烧和植被排放等。已有大量的研究证实在有机胺存在的情况下,SA(气态硫酸)或MSA(甲磺酸)等有机酸成核关键物种驱动的成核速率显著提高。有机胺由于其高的气相碱性,对成核的促进能力远远强于NH

然而,有机胺的种类繁多,目前气相中发现的有机胺有160余种,若包含凝结相中的氨基酸,有机胺的种类甚至达到近200种,但是目前仅仅研究了5种有机胺对甲磺酸新粒子生成的影响,要一一研究大气中有机胺对于甲磺酸新粒子生成的影响,不论是计算模拟还是实验研究,都有效率低,耗时长,成本昂贵的缺点,随着各类挥发性化学品的使用,大气中有机胺的种类也会越来越丰富。对于有机胺,能否与甲磺酸形成初始的1:1团簇对新粒子生成过程至关重要。因此,需要发展高效(高通量、低成本)的模拟预测技术。

发明内容

为解决上述技术问题,基于定量构效关系(QSAR)的计算模拟技术,通过建立有机胺与甲磺酸1:1团簇的形成自由能ΔG与各有机胺分子特征参数的关联,可有效预测有机胺促进甲磺酸新粒子生成的潜力,本发明提供一种预测大气中有机胺促进甲磺酸驱动新粒子生成潜力的线性回归方法,通过搜集文献,全面获取了目前存在于大气中的195种有机胺(包括存在于大气凝结相的31种氨基酸),选取其中的50种有机胺,涵盖脂肪胺,芳香胺,酰胺,哌嗪、氨基酸等有机胺种类,计算这50种有机胺与MSA 1:1团簇的形成自由能ΔG,利用多元线性回归的方法构建了形成自由自由能与有机胺分子特征参数之间的线性回归模型,并对模型应用域进行了表征,明确了模型的适用范围。

具体地,本发明构建了一种简单高效的预测有机胺与甲磺酸生成1:1团簇的形成自由能的多元线性回归模型方法,该方法可以根据有机胺的气相碱性GB,平均第一电离势Mi,径向分布函数RDF040s,预测有机胺与甲磺酸1:1团簇的形成自由能,为高效促进甲磺酸成核的有机胺的筛查提供基础工具;在建模过程中,参照经济合作与发展组织(OECD)对QSAR模型构建和使用的导则,进行了内、外部验证,考察模型的稳健性和预测能力。

本发明的技术方案如下:

一种预测有机胺促进甲磺酸新粒子生成潜力的多元线性回归方法,步骤如下:

(1)数据搜集与计算

从文献中查找到目前大气中存在的195种有机胺(其中包括31种氨基酸),选取其中50种有机胺,优化有机胺的分子结构,得到有机胺的最稳定构型,利用输出文件中的热力学参数计算它们与甲磺酸1:1团簇的形成自由能ΔG,同时搜集有机胺的气相碱性GB;

(2)计算有机胺的分子描述符

根据有机胺优化后的分子结构,将有机胺最稳定构型的.log文件转化为.mol文件,根据.mol文件计算50种有机胺的分子描述符平均第一电离势Mi和径向分布函数RDF040s;

(3)模型训练

将有机胺与甲磺酸的1:1团簇的形成自由能ΔG、气相碱性GB、平均第一电离势Mi和径向分布函数RDF040s数据合并;将数据集按3:1的比例随机拆分成训练集和验证集,以有机胺与甲磺酸的1:1团簇的形成自由能ΔG(单位:kcal mol

ΔG=-0.0500GB-123.780Mi-0.189RDF040s+182.222 (1)

(4)模型评估

使用训练集计算值-预测值决定系数R

最终模型的预测效果为:

有机胺与甲磺酸1:1团簇的形成自由能ΔG(单位:kcal mol

R

(5)应用域表征

采用Williams图对该模型进行应用域表征,即采用所选取的50种有机胺的杠杆值h对标准残差δ作图,h,δ和预警值h*计算方法如下:

其中,y

进一步地,所述50种有机胺的种类至少包括脂肪胺、芳香胺、酰胺、哌嗪和氨基酸。

进一步地,步骤(1)中通过在GAUSSIAN 09和ORCA4.0程序中分别利用密度泛函DFT方法和从头算ab initio方法优化有机胺的分子结构;步骤(2)中.mol文件是通过OpenBabel 2.3.2.2软件将GAUSSIAN 09的输出.log文件转化.mol文件得到的。

进一步地,步骤(2)中通过将.mol文件输入Dragon 6.0.0软件中进行计算。

进一步地,所述h*=0.3243。

本发明的有利效果是:所建模型能够有效预测有机胺与甲磺酸1:1团簇的形成自由能ΔG,反映了有机胺促进甲磺酸新粒子生成的潜力,具有良好的拟合能力、稳健性和预测能力,且具有明确表征的应用域。该方法简便高效、成本低,有望丰富宏观大气模式中的颗粒物形成机制,在空气质量模拟中发挥作用,为大气环境质量预测提供基础工具,服务于大气环境治理和蓝天保卫战的国家重大需求。

附图说明

图1预测大气中有机胺促进甲磺酸驱动新粒子生成潜力的线性回归方法的构建流程;

图2为有机胺与甲磺酸1:1团簇的形成自由能ΔG的计算值与预测值的线性拟合图(a)和表征模型应用域的Williams图(b),训练集和验证集有机胺的种类分别为37种和13种。

具体实施方式

以下结合附图和技术方案,进一步说明本发明的具体实施方式。

实施例1

如图1所示,一种预测有机胺促进甲磺酸新粒子生成潜力的多元线性回归方法,步骤如下:

(1)数据搜集与计算

从文献中查找到目前大气中存在的195种有机胺(其中包括31种氨基酸),选取其中50种有机胺,涵盖脂肪胺,芳香胺,酰胺,哌嗪和氨基酸,在GAUSSIAN09和ORCA4.0程序中分别利用密度泛函DFT方法和从头算ab initio方法优化有机胺的分子结构,得到有机胺的最稳定构型,并利用输出文件中的热力学参数计算它们与甲磺酸1:1团簇的形成自由能ΔG,同时搜集有机胺的气相碱性GB;

(2)计算有机胺的分子描述符

根据有机胺优化后的分子结构,通过OpenBabel 2.3.2.2软件将GAUSSIAN09的输出.log文件转化为.mol文件,将.mol文件输入Dragon 6.0.0软件中,计算有机胺的分子描述符平均第一电离势Mi和径向分布函数RDF040s;

(3)模型训练

将有机胺与甲磺酸的1:1团簇的形成自由能ΔG、气相碱性GB、平均第一电离势Mi和径向分布函数RDF040s数据合并;将数据集按3:1的比例随机拆分成训练集和验证集,以有机胺与甲磺酸的1:1团簇的形成自由能ΔG(单位:kcal mol

ΔG=-0.0500GB-123.780Mi-0.189RDF040s+182.222 (1)

(4)模型评估

使用训练集调整后的计算值-预测值决定系数R

最终模型的预测效果如下:

有机胺与甲磺酸1:1团簇的形成自由能ΔG(单位:kcal mol

R

模型的拟合性能如图2(a)所示,R

(5)参照OECD导则表征应用域

采用Williams图对该模型进行应用域表征,即采用所选取的50种有机胺的杠杆值(h)对标准残差(δ)作图,h,δ和预警值(h*)计算方法如下:

其中,y

实施例2

给定一个有机胺C

GB=883.9kJ mol

相应的计算值为:ΔG

实施例3

给定一个有机胺C

GB=948.6kJ mol

相应的计算值为:ΔG

实施例4

给定一个有机胺C

GB=960.1kJ mol

相应的计算值为:ΔG

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号