首页> 中国专利> 一种基于主分量分析评价环境空气质量的方法

一种基于主分量分析评价环境空气质量的方法

摘要

本发明公开了一种基于主分量分析评价环境空气质量的方法,属于大数据技术领域,包括生产标准化数据Yij、计算数据相关系数矩阵R、计算得出数据相关系数矩阵R的特征值λ1,λ2,…λp、统计主成份Fi、计算出综合得分F,解决了在原始数据信息丢失最小的情况下,对高纬变量空间进行降维处理的技术问题,本发明在保证原始数据信息损失最小的前提下,经过线性变换和舍弃部分信息,以少数的综合变量取代原有的多维变量,既抓住了主要矛盾又简化了评价工作,从而达到环境空气质量评价的目的。

著录项

  • 公开/公告号CN112365168A

    专利类型发明专利

  • 公开/公告日2021-02-12

    原文格式PDF

  • 申请/专利权人 南京雨后地软环境技术有限公司;

    申请/专利号CN202011277782.5

  • 发明设计人 王丽琼;任杰;梁志伟;

    申请日2020-11-16

  • 分类号G06Q10/06(20120101);G06Q50/26(20120101);G06F17/16(20060101);G06K9/62(20060101);G06N7/02(20060101);

  • 代理机构32231 常州佰业腾飞专利代理事务所(普通合伙);

  • 代理人滕诣迪

  • 地址 210013 江苏省南京市鼓楼区古平岗4号智梦园C座412-417室

  • 入库时间 2023-06-19 09:54:18

说明书

技术领域

本发明属于大数据技术领域,尤其涉及一种基于主分量分析评价环境空气质量的方法。

背景技术

主分量分析方法(Principal Component Analysis,PCA)也称主成分分析方法,通过降维的方式,将多指标转化为少数几个综合指标(即主成分),其中每个主成分都能反映原始变量的大部分数据信息,且所含信息互不重复,这种方法在引入多变量的同时也将复杂问题归结为几个主成分,使得问题简单化,同时得到的数据结果依然科学有效。目前业内的评价环境空气质量的方法众多,主要有:灰色聚类法、综合指数评价法、模糊综合评判法、改进密切值法和神经网络等。

灰色聚类法:在环境质量评价中,有限的时空监测数据所能提供的信息是按和非确知的,环境质量系统是一个灰色系统。聚类分析是采用数学定量手段确定聚类对象间的亲疏关系并进行分型化类的一种多元分析方法。灰色聚类是根据灰数的白化权函数将聚类对象对于不同指标所拥有的白化数按几个灰类进行聚合,得出观测对象对于各个灰类的聚类系数,然后按最大隶属原则确定聚类系数所属的类别,从而将观测指标或观测对象划分为若干个事先定义的不同类别,属于同一类的观测对象的集合构成一个聚类。利用灰色聚类法进行大气质量评价,不仅考虑了多因子的共同影响,并且不需要认为确定各因子的权重,因而即使灰色因素较多,也可准确得出结果,使评价具有很好的客观性。

综合指数评价法:综合污染指数法是根据各污染物的监测浓度值计算各污染物的指数,再从各污染物指数中得出综合指数,根据综合污染指数判定环境空气受污染的程度,为能更加各管地评价环境空气质量,在综合指数法的基础上,给各单项指数根据一定条件赋予一个权重值,各单项指数与权重值的乘积之和为评价综合污染指数,并将此法称为权重综合污染指数法,该方法对极端值进行了处理,根据分指数的大小不同分别赋予其不同的权重值,考虑了所有污染物对环境空气质量的影响,与综合污染指数法相比,对主要污染物在权重上有所侧重,评价结果也与实际情况能较好吻合。

模糊综合评判法:环境质量评价中,“污染程度”是一个模糊多变且庞大的概念,很难找出一个分明的界限,存在着很多不确定性因素,定量上具有明显的模糊性,从而作为评价污染程度的分级标准也应是模糊的。模糊数学法能解决空气环境系统中各因素间的不确定性和模糊性,能合理科学地评价环境空气质量的客观现状。所谓模糊综合评判法就是应用模糊变换原理和最大隶属度原则,考虑与评价事物相关事物的各个因素对其所作的综合评价。模糊综合评价的着眼点是所考虑的各个相关的因素。模糊综合评判法的特点是用隶属度来刻画环境质量分级的界限,并注意界限的模糊性,隶属度可用隶属函数来表达。因此,隶属度是进行模糊综合评判环境质量的核心。在模糊综合评判中要评价综合污染因子对环境质量的污染贡献,予以评价环境的环境质量的优劣程度,把环境系统作为事件,用不同的污染级别作决策,而最佳的对策就是被确定的环境质量级别,从而达到定量描述环境系统在各个污染物共同作用下的环境质量的优劣程度。

改进密切值法:密切值法是多目标决策的一种优选方法,最初多是将其用于样本的优劣排序,也用于环境监测布点的优化工作。改进密切值法继承了密切值法在样本优劣排序中的独到之处,将多指标转化为一个能综合反映环境质量的单指标是优化工作的基本途径,也是密切值法进行优化的基本思想。在将每一项污染指标进行归一化处理成无量纲指标后,以单指标的最大或最小值为评价的“最优点”或“最劣点”,求出各测点距“最优点”或“最劣点”的距离,反映样本的分级情况及样本间的优劣排序情况。

神经网络:依据标准对环境空气质量进行分级评价,实际上是一个模式识别和判别的问题。人工神经网络是一种模仿人类神经系统的只能型信息处理系统,它是具有实施学习与知识获取能力的人工智能算法,目前这种方法已在事故风险预测、社会经济和环境发展预测和模式识别技术方面得到应用,大型数学工具软件MATLAB也提供了人工神经网络的计算工具箱。人工神经网络(Artificial Neural Network,ANN)是建立以权重描述变量与目标之间特殊的线性关系的网络,或者说ANN是一种描述变量与目标之间特殊的非线性回归分析。一个人工神经网络的基本结构单元为神经元(neurons),神经元是一些相互连接可计算的元素,神经元按层次结构的形式进行组织,每层上的神经元以加权方式与其他层上的神经元连接,以构成神经网络。这种网络的特点是输入层(input layer)与隐层(hidden layer),隐层与输出层(output layer)的每个节点的作用是相互的,这与常规的模式识别技术有本质的不同。人工神经网络的学习过程包括了正向传播和反向传播。正向传播时,输入信息从输入层经隐层加权处理传想输出层,经过转换函数运算后得到的输出值与目标值(期望值)进行比较,如有误差,则误差反向传播,即反馈到原连接通路,通过逐层修改各层神经元的权系数,减少误差,如此循环,直到输出满足允许误差时为止。

以上方法在评价时均有一定的不足,如灰色聚类法所得结果分辨率较低,难以区分两极的变化特征;模糊综合评价评判法需对每个指标人为的给定一个权数,另外由于指标数量多,难以体现主要指标的作用,同时增加了评价工作量;改进密切值法的理论基础与计算过程都较为复杂;神经网络法目前算法技术研究还不够成熟,评价结果受人为因素影响较大。

发明内容

本发明的目的是提供一种基于主分量分析评价环境空气质量的方法,解决了在原始数据信息丢失最小的情况下,对高纬变量空间进行降维处理的技术问题。

为实现上述目的,本发明采用如下技术方案:

一种基于主分量分析评价环境空气质量的方法,包括如下步骤:

步骤1:客户端服务器和中心服务器,客户端服务器通过网线与中心服务器连接;

步骤2:用户通过客户端服务器输入环境监测站所采集到的环境指标数据,环境指标数据包括指标类型和指标值;

步骤3:客户端服务器将环境指标数据发送至中心服务器,中心服务器根据以下公式对环境指标数据进行标准化,生产标准化数据Y

其中,X

步骤4:中心服务器计算标准化数据Y

步骤5:中心服务器根据以下公式计算得出数据相关系数矩阵R的特征值λ

|λE

其中E

判断λ

步骤6:中心服务器根据以下公式计算主成分载荷矩阵,即原来变量X

其中,a

步骤7:中心服务器根据各主成分F

其中,F为综合得分,F

步骤8:中心服务器将步骤7的计算结果发送给客户端服务器,客户端服务器展示给用户。

优选的,在执行步骤4时,中心服务器采用SPSS19.0软件计算标准化数据Yij的数据相关系数矩阵。

优选的,所述环境监测站所采集到的环境指标数据包括PM

本发明所述的一种基于主分量分析评价环境空气质量的方法,解决了在原始数据信息丢失最小的情况下,对高纬变量空间进行降维处理的技术问题,本发明在保证原始数据信息损失最小的前提下,经过线性变换和舍弃部分信息,以少数的综合变量取代原有的多维变量,既抓住了主要矛盾又简化了评价工作,从而达到环境空气质量评价的目的。

附图说明

图1为本发明的12个监测站综合得分趋势变化图。

具体实施方式

由图1所示的一种基于主分量分析评价环境空气质量的方法,包括如下步骤:

步骤1:客户端服务器和中心服务器,客户端服务器通过网线与中心服务器连接;

步骤2:用户通过客户端服务器输入环境监测站所采集到的环境指标数据,环境指标数据包括指标类型和指标值;

本实施例采集到环境监测站的数据如下表1所示:

表1

其中CO浓度单位为mg/m

步骤3:客户端服务器将环境指标数据发送至中心服务器,中心服务器根据以下公式对环境指标数据进行标准化,生产标准化数据Y

其中,X

本实施例计算标准化后数据的主成分特征值、贡献率和累计贡献率如表2所示:

表2

步骤4:中心服务器计算标准化数据Y

步骤5:中心服务器根据以下公式计算得出数据相关系数矩阵R的特征值λ

|λE

其中E

判断λ

步骤6:中心服务器根据以下公式计算主成分载荷矩阵,即原来变量X

其中,a

本实施例计算得到的其因子载荷矩阵如表3所示:

表3

从表2和表3可知,第1个成分的特征值大于1,因此提取第一个主成分,除O

本实施例计算得出的主成分F1得分和综合得分F如表4所示:

表4

由表4排序可得,第一主成分F1的得分在2013-2014年之间呈下降趋势,在2015-2017年呈上升趋势,2015年得分最低,说明该监测站周边区域的污染程度在2013-2014年呈减轻趋势,在2015-2017年之间呈加重趋势,2015年污染程度最轻。综合得分的大小表示大气环境空气污染程度的重轻,即综合得分越大,大气环境污染程度越严重。从综合得分F来看,2013、2014年综合得分F呈下降趋势,在2015-2017年之间呈上升趋势,说明该监测站近五年来整体大气污染程度呈减轻趋势,但近三年来大气环境质量有所下降。

步骤7:中心服务器根据各主成分F

其中,F为综合得分,F

步骤8:中心服务器将步骤7的计算结果发送给客户端服务器,客户端服务器展示给用户。

优选的,在执行步骤4时,中心服务器采用SPSS19.0软件计算标准化数据Y

优选的,所述环境监测站所采集到的环境指标数据包括PM

表5为本实施例依次对12个环境监测站所采集到的环境指标数据进行分析的结果:

表5

如图1和表5所示,F监测站、J监测站和L监测站3个监测站周边空气污染状况呈逐年上升趋势,这与监测站周边工业生产活动有关,后续应加强相应企业的排污管理;其余监测站虽有小幅波动,但总体呈下降趋势,说明近些年该市整体大气污染状况得到改善,环境空气质量有所提升。

图1中F为综合得分,A、B、C、D、E、F、G、H、I、J、K、L和M分别代表A监测站、B监测站、C监测站、D监测站、E监测站、F监测站、G监测站、H监测站、I监测站、J监测站、K监测站、L监测站和M监测站的综合得分线,year为年份。

本发明所述的一种基于主分量分析评价环境空气质量的方法,解决了在原始数据信息丢失最小的情况下,对高纬变量空间进行降维处理的技术问题,本发明在保证原始数据信息损失最小的前提下,经过线性变换和舍弃部分信息,以少数的综合变量取代原有的多维变量,既抓住了主要矛盾又简化了评价工作,从而达到环境空气质量评价的目的。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号