首页> 中文学位 >基于空气质量数据解析大气复合污染时空特征及过程序列
【6h】

基于空气质量数据解析大气复合污染时空特征及过程序列

代理获取

目录

声明

论文说明

致谢

摘要

图目录

表目录

1 绪论

1.1 研究背景

1.1.1 环境管理信息化形势下的数据挖掘

1.1.2 面向大气复合污染的环境管理模式

1.2 研究方法概述

1.2.1 大气复合污染特征及其机制的研究方法概述

1.2.2 基于空气质量数据分析的大气复合污染研究方法概述

1.3 研究目标

1.4 研究思路

1.5 技术路线

2 数据与方法

2.1 数据来源与收集、处理方法

2.1.1 数据来源

2.1.2 数据收集

2.1.3 数据预处理

2.2 分析平台——R工具

2.3 关联规则发现的基本理论与R语言实现

2.3.1 基本原理

2.3.2 应用简介

2.3.3 R语言实现

2.4 序列模式挖掘的基本理论与R语言实现

2.4.1 基本原理

2.4.2 应用筒介

2.4.3 R语言实现

2.5 方法检验

2.5.1 关联规则

2.5.2 序列模式

2.6 小结

3 大气复合污染的污染物指标关联规则发现

3.1 数据分析

3.1.1 方案设计

3.1.2 编程与运算

3.2 结果输出

3.2.1 不同污染程度规则

3.2.2 三大经济区规则

3.2.3 北方和南方规则

3.2.4 东,中、西、东北部规则

3.2.5 1-7时段规则

3.3 时空特征分析

3.3.1 大气复合污染区域特征

3.3.2 大气复合污染时段特征

3.4 小结

4 大气复合污染的污染物指标序列模式挖掘

4.1 数据分析

4.1.1 方案设计

4.1.2 编程与运算

4.2 结果输出

4.3 过程序列分析

4.3.1 PM2.5污染过程

4.3.2 O3污染过程

4.4 小结

5 研究结论、创新点及展望

5.1 研究结论

5.2 创新点

5.3 展望

参考文献

硕士期间参加科研工作情况

展开▼

摘要

以PM2.5和O3为特征的区域大气复合污染已成为制约我国京津冀、长三角、珠三角和其他快速发展城市群区域经济发展的重大瓶颈因素。在过去十年里,以PM2.5和O3为主要污染物,CO、SO2、NO2、PM10等多种污染物并存的大气复合污染问题日益突显。为此,环境管理信息化逐步建设与发展,必将产生一个庞大的环境空气质量数据库。随之,以环境监测数据和环境科学理论为决策依据的大气复合污染环境管理模式正在悄然形成。挖掘海量环境空气质量信息资源,以发现数据中潜在的概念和规律,揭示大气环境复合污染形成机制与发生根因,可为环境管理决策提供科学支撑。纵观国内外基于环境空气质量数据的大气环境复合污染研究方法,有灰色关联分析、主成分分析、Spearman秩相关系数法、线性相关性分析等基于传统统计学的关联分析技术;神经网络、支持向量机、层次贝叶斯等数据挖掘的分类预测技术;K-means聚类、模糊推理等数据挖掘的聚类分析技术,在识别多污染物相关关系,污染物浓度预测方面取得了大量研究成果,并且,数据挖掘的关联分析技术也可以应用于环境信息的分析与预测。本论文延续了利用空气质量数据解析大气污染问题的思路和相关关系思想,基于全国190个城市945个监测站点的实时空气质量数据,运用计算机领域中关联规则发现和序列模式挖掘原理,建立了解析大气复合污染状态及其变化过程的方法,从PM2.5和O3着手,揭示了污染物的关联关系及其时空特征、在污染过程中表现出的序列特征,这有助于面向大气复合污染问题的环境管理决策,也为海量空气质量数据的资源化利用提供新途径。本论文的研究结论对政府监管、科学研究、公众预防都有积极的意义。
  重点研究内容:
  1.海量数据自动采集和购物篮数据库构建。录制脚本与自编程序相结合实现自动采集全国城市空气质量实时监测数据,现收集了2013年9月4日至12月4日的3个月的数据;在数据中添加了站点空间属性数据和监测时间数据;采用离散化方法,进行符合数据挖掘格式的预处理,构建购物篮数据库。
  2.面向大气复合污染的关联规则发现和序列模式挖掘的实现。基于真实的环境空气质量数据,关联规则与序列模式原理,选择分析平台与算法,设计面向大气复合污染的挖掘方案,编写R语言程序,建立大气复合污染物指标关联规则和序列模式挖掘方法。
  3.大气复合污染关联规则和序列模式的识别。(1)识别包含PM2.5或O3指标的强关联规则。即频繁出现的包含PM2.5或O3指标的关联规则及其置信度,并分析规则的时空特征,解析在不同经济区、经纬区和日时段与PM2.5或O3关联性强的大气复合污染物。(2)识别包含PM2.5或O3指标的强序列模式。即不同时间间隔下频繁出现的包含PM2.5或O3指标的序列及其支持度,解析PM2.5及O3在大气复合污染过程中的序列特征。
  主要研究结论:
  1.在全国范围,大气中多种污染物共同存在比一种污染物单独存在更容易并发严重的PM2.5污染。当低浓度(二级)的CO,NO2,SO2和PM10(六级)共存时,PM2.5六级发生的概率为93.0%,而每种污染物单独存在情况下PM2.5六级发生的最高概率仅为65.7%。
  2.在东北地区,大气中PM10六级与NO2三级组合存在或NO2三级单独存在时,极易发生PM2.5六级污染,概率在98%左右。在京津唐经济区,大气中PM10达到六级、CO、NO2、SO2达到二至三级时,多种组合下发生PM2.5六级污染的概率高,在90%左右。大气中PM10与PM2.5的关联南方大于北方,东部大于西部。CO、NO2与PM2.5的关联北方大于南方,东部大于西部。SO2与PM2.5的关联北方大于南方。
  3.23:00-6:00和14:00-16:00时段出现的大气污染物指标规则置信度大于0.9。从全国平均看,1-7时段发生PM2.5污染的容易度:T=7>T=6>T=5>T=4>T=1>T=3>T=2。T=2、3时段,即9:00-11:00和12:00-13:00,为一天中大气较清洁的时间段;T=1、4时段,即7:00-8:00和14:00-16:00,为一天中的轻污染时段;T=5、6、7时段,即17:00-6:00,为一天中PM2.5污染较严重的时间段。在东北地区,T=3、4、6、7时段,即12:00-16:00和20:00-6:00,为一天中PM2.5污染严重的时间段。在PM2.5严重污染较难发生的时段,PM10六级和某种污染物共存于大气中,在PM2.5严重污染较易发生的时段,污染物种类较多,CO、SO2、NO2、PM10之间复杂混合。
  4.PM2.5浓度维持稳定,逐级加重,逐级减轻所需时间随污染程度改变。PM2.5维持稳定的最长时间是24h,随着污染程度的加重,失稳时间由12-24h变为3h,逐级加重所需时间由12-24h变为1-3h。除六级降为五级约为1h外,PM2.5污染逐级减轻所需的典型时间是12-24h。PM10、CO、NO2、SO2都与PM2.5表现出序列关系。
  5.O3二级的维持时间比三级持久,O3浓度倾向于稳定而非加重或减轻。多种大气污染物中只有NO2与O3表现出强序列关系。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号