首页> 中国专利> 一种垃圾焚烧废气二噁英超标预测预警方法

一种垃圾焚烧废气二噁英超标预测预警方法

摘要

一种垃圾焚烧废气二噁英超标预测预警方法,利用历史不同企业、不同焚烧炉、不同污染物传感器和温度传感器等采集的特征数据,以及对应的烟气二噁英检测结果是否超过国家行业标准限值,采用随机森林算法训练出以上各种特征和二噁英达标与否关系的算法模型;采用该模型对实时采集的各种特征数据以及企业名称和焚烧炉编码进行二噁英超标可能性预测;从垃圾焚烧运行工况、烟气处理设施的运行效果、管理水平等二噁英可能生成和去除的各环节入手,可以进行实时监测,并且进行大数据算法训练,建立大数据分析方法和自动监控预警算法,拟合二噁英浓度是否达标数据,对二噁英超标排放实时预测和预警。

著录项

说明书

技术领域

本发明涉技术领域,具体是一种垃圾焚烧废气二噁英超标预测预警方法。

背景技术

生活垃圾焚烧产生的二噁英受到的关注程度最高,焚烧生活垃圾产生二噁英的机理比较复杂;生活垃圾焚烧废气产生的二噁英浓度较低,ng/m

生态环境部要求全国所有垃圾焚烧企业于2017年9月30日前全面完成“装、树、联”三项任务,即依法依规安装污染物排放自动监测设备、厂区门口树立电子显示屏实时公布污染物排放和焚烧炉运行数据、自动监测设备与环保部门联网。2019年生态环境部发布《生活垃圾焚烧发电厂自动监测数据应用管理规定》,规定垃圾焚烧厂任一焚烧炉排放烟气中颗粒物、氮氧化物、二氧化硫、氯化氢、一氧化碳等污染物的自动监测日均值数据和炉膛平均温度,作为行政执法的证据。

发明内容

本发明所要解决的技术问题是提供一种垃圾焚烧废气二噁英超标预测预警方法,可以有效解决上述背景技术中提出的问题。

为解决上述问题,本发明所采取的技术方案是:一种垃圾焚烧废气二噁英超标预测预警方法,其方法包括以下步骤:

步骤一:与焚烧炉氮氧化物传感器建立通信,获得废气中的氮氧化物浓度;

步骤二:与焚烧炉碳化物传感器建立通信,获得废气中的一氧化碳的浓度;

步骤三:与焚烧炉硫化物传感器建立通信,获得废气中的二氧化硫的浓度;

步骤四:与焚烧炉氯化物传感器建立通信,获得废气中氯化氢的浓度;

步骤五:与焚烧炉烟尘传感器建立通信,获得废气中的烟尘的浓度;

步骤六:与焚烧炉温度传感器建立通信,获得焚烧炉的平均炉温和DCS转换温度;

步骤七:对该企业和焚烧炉进行One-Hot Encoding独热编码;

步骤八:采用随机森林算法训练出以上步骤一至七获得的数据、特征和二噁英达标与否关系的算法模型,采用该算法模型对实时采集的各种特征数据以及企业和焚烧炉编码进行二噁英达标预测预警;

步骤九:从步骤一到步骤八往复进行闭环控制。

作为本发明的进一步优选方案,所述随机森林算法是一种由决策树等单分类器组成的集成分类算法,假定三个单分类器对三个测试样本表现,其中1表示分类正确,0表示分类错误;集成分类结果通过voting投票法产生。

作为本发明的进一步优选方案,所述随机森林算法对历史数据预测的准确率达不到设定的阈值,则将步骤一至七获得的历史数据重复进行随机森林算法训练。

作为本发明的进一步优选方案,所述随机森林算法对历史数据预测的准确率达到设定的阈值,对步骤一至七中获得的最新一次的数据进行二噁英是否达标结果预测。

作为本发明的进一步优选方案,步骤一至七的最新数据超标可能性预测对比小于二噁英达标阈值,则继续获取废气中各物质的数据。

作为本发明的进一步优选方案,步骤一至七的最新数据超标可能性预测大于或等于二噁英预警阈值,则进行预警提醒。

与现有技术相比,本发明提供了一种垃圾焚烧废气二噁英超标预测预警方法,具备以下有益效果:

从垃圾焚烧运行工况、烟气处理设施的运行效果、管理水平等二噁英可能生成和去除的各环节入手,可以进行实时监测,并且进行大数据的随机算法重复比对,建立大数据分析方法和自动监控预警算法,拟合二噁英浓度是否达标数据,对二噁英超标排放实时预测和预警。

附图说明

图1为本发明基于随机森林算法对垃圾焚烧行业废气二噁英超标预测预警方法的流程图;

图2为本发明实际监测并用于随机森林算法训练的各成分数据表;

图3为本发明随机森林的结果为三棵决策树的投票结果表。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。

参照说明书附图1本发明提供一种垃圾焚烧废气二噁英超标预测预警方法,其方法包括以下步骤:

步骤一:与焚烧炉氮氧化物传感器建立通信,获得废气中的氮氧化物浓度;

步骤二:与焚烧炉碳化物传感器建立通信,获得废气中的一氧化碳的浓度;

步骤三:与焚烧炉硫化物传感器建立通信,获得废气中的二氧化硫的浓度;

步骤四:与焚烧炉氯化物传感器建立通信,获得废气中氯化氢的浓度;

步骤五:与焚烧炉烟尘传感器建立通信,获得废气中的烟尘的浓度;

步骤六:与焚烧炉温度传感器建立通信,获得焚烧炉的平均炉温和DCS转换温度;

步骤七:对该企业和焚烧炉进行One-Hot Encoding独热编码;

步骤八:采用随机森林算法训练出以上步骤一至七获得的数据、特征和二噁英达标与否关系的算法模型,采用该算法模型对实时采集的各种特征数据以及企业和焚烧炉编码进行二噁英达标预测预警;

步骤九:从步骤一到步骤八往复进行闭环控制。

作为本发明的进一步优选方案,所述随机森林算法是一种由决策树等单分类器组成的集成分类算法,假定三个单分类器对三个测试样本表现,其中1表示分类正确,0表示分类错误;集成分类结果通过voting投票法产生。

作为本发明的进一步优选方案,所述随机森林算法对历史数据预测的准确率达不到设定的阈值,则将步骤一至七获得的历史数据重复进行随机森林算法训练。

作为本发明的进一步优选方案,所述随机森林算法对历史数据预测的准确率达到设定的阈值,对步骤一至七中获得的最新一次的数据进行二噁英是否达标结果预测。

作为本发明的进一步优选方案,步骤一至七的最新数据超标可能性预测对比小于二噁英达标阈值,则继续获取废气中各物质的数据。

作为本发明的进一步优选方案,步骤一至七的最新数据超标可能性预测大于或等于二噁英预警阈值,则进行预警提醒。

作为本发明的一个具体实施例:

假定三个单分类器对三个测试样本表现,其中1表示分类正确,0表示分类错误;集成分类结果通过voting投票法产生;也可以假定多个单分类器对多个测试样本进行集成分类结果投票;

h

随机森林是一个并行式集成学习方法,其是以决策树为单学习器构建并行集成的基础上,进一步在决策树的训练过程中引入了随机属性和随机树选择。

决策树是一种对样本特征按照信息增益大小排序,然后分别对每个属性进行分类的单分类器。

信息增益(Gain)表示信息熵(Ent)的变化:

其中样本集合D中第k类样本所占的比例为p

随机森林就是由以上若干个决策树组成的集成分类器;每个决策树随机的选择样本属性进行预测,最后得到结果,整个决策树组成的森林可以进行投票,最后输出样本属于不达标类别的概率。

划分数据集之后信息发生的变化称为信息增益,可以计算每个特征值划分数据集获得的信息增益,获得信息增益最高的特征就是最好的选择;集合信息的度量方式称为香农熵或者简称为熵entropy,熵定义为信息的期望值。在信息论与概率统计中,熵是表示随机变量不确定性的度量。如果待分类的事物可能划分在多个分类之中,则符号x

通过上式,我们可以得到所有类别的信息;为了计算熵,我们需要计算所有类别所有可能值包含的信息期望值(数学期望),通过下面的公式得到:

其中n是分类的数目。熵越大,随机变量的不确定性就越大。

当熵中的概率由数据估计(特别是最大似然估计)得到时,所对应的熵称为经验熵(empirical entropy);我们定义样本数据表中的数据为训练数据集D,则训练数据集D的经验熵为H(D),|D|表示其样本容量,即样本个数。设有K个类Ck, = 1,2,3,...,K,|C

结合图2,在17个数据中,8个数据的结果达标,9个数据的结果为不达标。所以数据集D的经验熵H(D)为:

信息增益是相对于特征而言的。所以,特征A对训练数据集D的信息增益g(D,A),定义为集合D的经验熵H(D)与特征A给定条件下D的经验条件熵H(D|A)之差,即:

g(D,A)=H(D)-H(D|A);

其中设特征A有n个不同的取值{a

给定训练集D和连续属性a,a在D上出现了n个不同的取值,先把这些值从大到小排序,记为{a

即把区间[a

然后可以像处理离散属性值那样考虑划分点,选择最优的划分点进行样本集合的划分,使用的公式如下:

其中Gain(D,a,t)是岩本集D基于划分点t二分后的信息增益,划分的时候,选择使用Gain(D,a,t)最大的划分点。

对于数据集中的属性“烟尘”,决策树开始学习时,根节点包含的17个训练样本在该属性上取值为连续性特征值。我们先把“烟尘”这些值从小到大排序:{0.243,0.245,0.343,0.36,0.403,0.439,0.481,0.556,0.593,0.608,0.634,0.639,0.657,0.666,0.697,0.719,0.774};根据上述公式Ta的公式代入可得Tmidu={0.244,0.294,0.351,0.381,0.42,0.459,0.518,0.574,0.6,0.621,0.636,0.648,0.661,0.681,0.708,0.746};当t=0.244的时候,Dt-={0.243},而Dt+={0.245,0.343,……0.774};进而得到:

当t=0.294的时候,Dt-={0.243,0.245},而Dt+={0.343,0.36……0.774};进而得到:

重复以上步骤,对t分别取值,可以得到当t=0.381;g(D,烟尘,t)取得最大值0.263。

对“二氧化硫”的属性数据,同样的计算,能够计算出:当t=0.126,进而可以得到g(D,二氧化硫,t)的最大值为0.349;最后对所有属性计算信息增益得到最大信息增益的属性作为决策树的起点。

选出第一个决策起点后再重复计算最大信息增益的属性作为再次决策的起点,直到不能划分为止;就形成一个完整的决策树,为了避免训练得到决策树对新采集的数据预测出现过拟合问题,所以我们训练使用的数据并不是完整数据,而是随机挑选的历史数据去训练一个决策树

结合图3,使用决策树和随机森林对ID为18-19的样本进行预测,结果为正确或者错误;随机森林的结果为三棵决策树的投票结果;三个准确率都为66%的决策树组成的随机森林模型投票后的准确率达到了100%,符合真实测量结果;所以集成学习算法的随机森林很大程度上提高了预测准确率。

训练模型是指将历史数据随机拆分为不均等两份,多的部分数据作为训练集,少的为测试集;在训练集中建立氮氧化物、一氧化碳、二氧化硫、氯化氢、烟尘颗粒物、平均温度、DCS转换温度、企业名称和焚烧炉编码同目标检测结果关系的随机森林算法模型;将模型作用于测试集,实时反馈测试结果并进行不断的模型优化;反馈调节模型的最大树深度和随机树的选取,当达到最大迭代次数或者达到设定准确率阈值优化结束;训练得到的模型对实时采集数据进行二噁英预测预警。

譬如,历史数据包含全国多家企业名称和焚烧炉二噁英检测结果和相关氮氧化物、一氧化碳、二氧化硫、氯化氢、烟尘颗粒物、平均温度、DCS转换温度的特征数据,共计20000条,将历史数据随机分为16000和4000两份,16000条记录作为训练集,4000条记录作为测试集;利用训练集,建立以氮氧化物、一氧化碳、二氧化硫、氯化氢、烟尘颗粒物、平均温度、DCS转换温度、企业名称和焚烧炉编码作为输入,二噁英达标与否作为输出的随机森林算法模型,用测试集来测试训练集得到模型的效果,不断重复训练和测试过程,直到测试准确率达到设定阈值或者重复次数达到设定的最大迭代次数;最后得到的模型对实时采集的数据进行预测预警;如设定的模型预警概率为0.5,当模型对一条采集数据进行预测结果为0.3,预测概率小于0.5,不报警;继续对下一条采集数据进行预测,如预测结果为0.6,大于设定的0.5阈值,则进行二噁英超标预测预警。

以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号