首页> 中国专利> 基于聚类的景区村落地下水生态环境监测采样点优选方法

基于聚类的景区村落地下水生态环境监测采样点优选方法

摘要

本发明涉及一种基于聚类的景区村落地下水生态环境监测采样点优选方法,在景区村落地下水采样点的选择上,利用基于改进凝聚层次的聚类算法对符合采样原则的采样点进行进一步优选,以选取出最具特征性的代表性采样点。整个处理过程简单有效,对采样点的选取进行合理性的精确定位,从而保证了优选采样点的代表性和可靠性,对于较大规模的生态环境监测采样点的优选具有现实意义。

著录项

  • 公开/公告号CN103942730A

    专利类型发明专利

  • 公开/公告日2014-07-23

    原文格式PDF

  • 申请/专利权人 冷明;

    申请/专利号CN201410157179.1

  • 申请日2014-04-20

  • 分类号G06Q50/06;G06F17/30;

  • 代理机构

  • 代理人

  • 地址 343009 江西省吉安市吉州区安宁路15号6栋101室

  • 入库时间 2023-12-17 01:00:24

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-04-03

    未缴年费专利权终止 IPC(主分类):G06F17/30 授权公告日:20181204 终止日期:20190420 申请日:20140420

    专利权的终止

  • 2018-12-04

    授权

    授权

  • 2018-11-02

    著录事项变更 IPC(主分类):G06Q50/06 变更前: 变更后: 申请日:20140420

    著录事项变更

  • 2014-08-20

    实质审查的生效 IPC(主分类):G06Q50/06 申请日:20140420

    实质审查的生效

  • 2014-07-23

    公开

    公开

说明书

技术领域

本发明涉及一种基于聚类的景区村落地下水生态环境监测采样点优选方法。

背景技术

随着经济的快速发展,我国的生态环境面临越来越重的压力,生态环境问题日益突出。对生态环境的监测与预警是维护生态绿色和可持续发展的一个重要的举措,也是对生态环境问题进行研究和应对的重要手段之一。对生态环境的采样则是环境监测和预警至关重要的一环,这个环节出现问题或者选择不当,后续的分析工作无论多么精确,其结果都是毫无意义的,由此得出的结果也将误导我们对生态环境的评判。

在生态环境的采样过程中,如何合理选择采样点是获得准确而可靠的环境监测数据面对的问题。当前的采样点选取都只是简单的依循采样点选取原则进行随意选取,这些文字上的原则无所谓优选和代表性,无法对大量的符合采样原则的采样点做进一步的精选,从而导致多数情况下采样点选取过于随意,仅仅满足原则就行。一些被选上的采样点不具有典型特征,不能反映所在区域的普遍共性,由此从该采样点得出的采样数据也变得缺乏意义。因此,环境监测采样点的优选是生态环境监测中一个重要的环节,要在有限的条件下获得最为理想的生态环境数据就必须进行合理的采样点优选。

本发明利用数据预处理技术对生态环境监测数据样本集进行处理之后,再利用改进的凝聚层次聚类方法对环境监测数据进行聚类,最后选出距离聚类中心最近的采样点作为优选采样点。整个处理过程简单有效,对于较大规模的生态环境监测采样点的优选具有现实意义。

发明内容

本发明的目的在于针对已有技术存在的不足,提供一种基于聚类的景区村落地下水生态环境监测采样点优选方法。为达到上述目的,本发明的构思如下:在景区村落地下水采样点的选择上,利用基于改进凝聚层次的聚类算法对符合采样原则的采样点进行进一步优选,以选取出最具特征性的代表性采样点。整个处理过程简单有效,对于较大规模的生态环境监测采样点的优选具有现实意义。

根据上述的发明构思,本发明的技术方案是这样实现的:一种基于改进凝聚层次聚类的景区村落地下水采样点优选方法,其特征在于,具体步骤如下。

步骤1,景区村落地下水生态环境监测数据样本集标准化处理,使用数据标准化技术对景区村落地下水采样点的生态环境监测数据样本集进行标准化处理,建立起具有独立性且属性权重适当的景区村落地下水生态环境标准化度量数据矩阵。

步骤2,计算出景区村落地下水生态环境监测采样簇的数目和采样簇的中心,在景区村落地下水生态环境标准化度量数据矩阵基础上,通过基于改进凝聚层次聚类方法计算出景区村落地下水生态环境监测采样簇的数目和采样簇的中心。

步骤3,确定并输出景区村落地下水生态环境监测优选采样点的位置,通过计算新的景区村落地下水生态环境监测采样簇中最靠近簇中心的景区村落地下水采样点,确定并输出景区村落地下水生态环境监测优选采样点的位置。

上述的步骤1中,所述的景区村落地下水生态环境监测数据样本集标准化处理的步骤如下。

步骤1.1,构造景区村落地下水的生态环境数据集矩阵,在景区村落地下水采样点的生态环境监测数据样本集基础上,建立起景区村落地下水的生态环境数据集矩阵。景区村落地下水生态环境数据集矩阵由所有景区村落地下水生态环境监测采样点的经纬度和监测指标值构成。景区村落地下水生态环境数据集矩阵的每一行代表一个景区村落地下水生态环境监测采样点,由该景区村落地下水生态环境监测采样点的经纬度和监测指标值构成。景区村落地下水的生态环境数据集矩阵的第i行第1列数据表示为第i个景区村落地下水生态环境监测采样点的经度,景区村落地下水的生态环境数据集矩阵的第i行第2列数据表示为第i个景区村落地下水生态环境监测采样点的纬度,景区村落地下水的生态环境数据集矩阵的第i行第j (j>2)列数据表示为第i个景区村落地下水生态环境监测采样点的第j-2个景区村落地下水生态环境监测指标值。

步骤1.2,计算每个景区村落地下水生态环境监测指标的平均绝对偏差,在景区村落地下水的生态环境数据集矩阵基础上,计算出每个监测指标在所有景区村落地下水生态环境监测采样点的平均值,进而计算出每个监测指标在所有景区村落地下水生态环境监测采样点的平均绝对偏差。如果该景区村落地下水生态环境监测指标的平均绝对偏差为零,则将其代表的列从景区村落地下水的生态环境数据集矩阵移除。

步骤1.3,计算得到景区村落地下水生态环境标准化度量数据矩阵,计算所有景区村落地下水生态环境监测采样点的所有监测指标的标准化度量值,即景区村落地下水的生态环境数据集矩阵的第i个景区村落地下水生态环境监测采样点的第j个景区村落地下水生态环境监测指标值,减去第j个景区村落地下水生态环境监测指标在所有景区村落地下水生态环境监测采样点的平均值,再除以第j个景区村落地下水生态环境监测指标的平均绝对偏差,进而得到景区村落地下水生态环境标准化度量数据矩阵。

上述的步骤2中,所述的通过改进凝聚层次聚类方法计算出景区村落地下水生态环境监测采样簇的数目和采样簇的中心步骤如下。

步骤2.1,景区村落地下水生态环境标准化度量数据矩阵的每行代表着一个景区村落地下水生态环境监测采样初始簇,即景区村落地下水生态环境标准化度量数据矩阵的n行代表着n个景区村落地下水生态环境监测采样初始簇。

步骤2.2,计算得到景区村落地下水生态环境标准化度量相异度矩阵,在确定n个景区村落地下水生态环境监测采样初始簇的基础上,计算出n个景区村落地下水生态环境监测采样初始簇相互之间的明考斯基距离,表示为n个景区村落地下水生态环境监测采样初始簇相互之间的特征相异度Sij,进而得到景区村落地下水生态环境标准化度量相异度矩阵。

步骤2.3,计算得到景区村落地下水生态环境监测采样簇相异度三元组,对n个景区村落地下水生态环境监测采样初始簇相互之间的特征差异度值Sij按升序进行Heap堆排序,并组成相应的景区村落地下水生态环境监测采样簇相异度三元组 (Ci, Cj, Sij),其中i≥j,且采样簇Ci和采样簇Cj的差异度为Sij

步骤2.4,移除景区村落地下水生态环境监测采样簇差异度三元组中相异度排序后最大的40%的三元组,由于景区村落地下水生态环境监测指标误差的存在,且相异度高于平均值将难以在同一个景区村落地下水生态环境监测采样簇中出现,因此需要移除景区村落地下水生态环境监测采样簇相异度三元组中相异度Sij排序后最大的40%的三元组。

步骤2.5,合并两个景区村落地下水生态环境监测采样簇得到新的景区村落地下水生态环境监测采样簇,取出景区村落地下水生态环境监测采样簇相异度三元组排序中最小的三元组(Ci, Cj, Sij),对其中的采样簇Ci和采样簇Cj进行合并,合并之后新的景区村落地下水生态环境监测采样簇记为簇Np,其中p初始值等于1,然后p自增1。

步骤2.6,重复合并景区村落地下水生态环境监测采样簇相异度三元组排序中最小的两个采样簇,取出景区村落地下水生态环境监测采样簇相异度三元组排序中最小的三元组(Ci, Cj, Sij),对其中的采样簇Ci和采样簇Cj进行合并。如果采样簇Ci和采样簇Cj都没有出现在新簇中,那么合并采样簇Ci和采样簇Cj并组成新簇Np,p自增1如果采样簇Ci和采样簇Cj都出现在新簇Np中,执行步骤2.7;如果采样簇Ci和采样簇Cj其中一个已被合并在新簇中,则另一个采样簇也被合并到该新簇中;如果采样簇Ci和采样簇Cj分别被合并在不同的新簇中,则合并采样簇Ci和采样簇Cj并组成新簇Np,p自增1。

步骤2.7,如果景区村落地下水生态环境监测采样簇相异度三元组堆排序中没有三元组,则计算结束,返回p个新的景区村落地下水生态环境监测采样簇,否则执行步骤2.6。

上述的步骤3中,所述的计算并输出景区村落地下水生态环境监测优选采样点的位置步骤如下。

步骤3.1,计算所有新的景区村落地下水生态环境监测采样簇的中心点位置,采用重心法计算出p个新的景区村落地下水生态环境监测采样簇的中心点位置。

步骤3.2,确定并输出p个景区村落地下水生态环境监测优选采样点,对每个新的景区村落地下水生态环境监测采样簇的中心点位置,以欧几里得距离为度量方法计算出离该景区村落地下水生态环境监测采样簇中心点最近的景区村落地下水生态环境监测采样点,确定并输出该采样点作为最终的景区村落地下水生态环境监测优选采样点。

本发明与现有技术相比较,具有如下显而易见的突出实质性特点和显著优点。

本发明利用数据预处理技术对生态环境监测数据样本集进行处理之后,再利用改进的凝聚层次聚类方法对环境监测数据进行聚类,最后选出距离聚类中心最近的采样点作为优选采样点。整个处理过程简单有效,对采样点的选取进行合理性的精确定位,保证了优选采样点的代表性和可靠性,对于较大规模的生态环境监测采样点的优选具有现实意义。

通过以下对本发明基于聚类的景区村落地下水生态环境监测采样点优选方法的实例结合其附图的描述,可以进一步理解本发明的目的、具体结构特征和优点。

图1是本发明基于聚类的景区村落地下水生态环境监测采样点优选方法的流程图。

图2是本发明景区村落地下水生态环境监测数据样本集标准化处理的流程图。

图3是本发明基于改进凝聚层次聚类方法计算出景区村落地下水生态环境监测采样簇的数目和采样簇的中心的流程图。

具体实施方式。

为了能够更清楚地理解本发明基于聚类的景区村落地下水生态环境监测采样点优选方法的技术内容,特举以下实例详细说明。

本实施例的基于聚类的景区村落地下水生态环境监测采样点优选方法的流程图如图1所示。

101:景区村落地下水生态环境监测数据样本集标准化处理,使用数据标准化技术对景区村落地下水采样点的生态环境监测数据样本集进行标准化处理,建立起具有独立性且属性权重适当的景区村落地下水生态环境标准化度量数据矩阵。

102:计算出景区村落地下水生态环境监测采样簇的数目和采样簇的中心,在景区村落地下水生态环境标准化度量数据矩阵基础上,通过基于改进凝聚层次聚类方法计算出景区村落地下水生态环境监测采样簇的数目和采样簇的中心。

103:确定并输出景区村落地下水生态环境监测优选采样点的位置,通过计算新的景区村落地下水生态环境监测采样簇中最靠近簇中心的景区村落地下水采样点,确定并输出景区村落地下水生态环境监测优选采样点的位置。

本实施例的景区村落地下水生态环境监测数据样本集标准化处理的流程图如图2所示。

201:构造景区村落地下水的生态环境数据集矩阵,在景区村落地下水采样点的生态环境监测数据样本集基础上,建立起景区村落地下水的生态环境数据集矩阵。景区村落地下水生态环境数据集矩阵由所有景区村落地下水生态环境监测采样点的经纬度和监测指标值构成。景区村落地下水生态环境数据集矩阵的每一行代表一个景区村落地下水生态环境监测采样点,由该景区村落地下水生态环境监测采样点的经纬度和监测指标值构成。景区村落地下水的生态环境数据集矩阵的第i行第1列数据表示为第i个景区村落地下水生态环境监测采样点的经度,景区村落地下水的生态环境数据集矩阵的第i行第2列数据表示为第i个景区村落地下水生态环境监测采样点的纬度,景区村落地下水的生态环境数据集矩阵的第i行第j (j>2)列数据表示为第i个景区村落地下水生态环境监测采样点的第j-2个景区村落地下水生态环境监测指标值。

202:计算每个景区村落地下水生态环境监测指标的平均绝对偏差,在景区村落地下水的生态环境数据集矩阵基础上,计算出每个监测指标在所有景区村落地下水生态环境监测采样点的平均值,进而计算出每个监测指标在所有景区村落地下水生态环境监测采样点的平均绝对偏差。如果该景区村落地下水生态环境监测指标的平均绝对偏差为零,则将其代表的列从景区村落地下水的生态环境数据集矩阵移除。

203:计算得到景区村落地下水生态环境标准化度量数据矩阵,计算所有景区村落地下水生态环境监测采样点的所有监测指标的标准化度量值,即景区村落地下水的生态环境数据集矩阵的第i个景区村落地下水生态环境监测采样点的第j个景区村落地下水生态环境监测指标值,减去第j个景区村落地下水生态环境监测指标在所有景区村落地下水生态环境监测采样点的平均值,再除以第j个景区村落地下水生态环境监测指标的平均绝对偏差,进而得到景区村落地下水生态环境标准化度量数据矩阵。

本实施例的基于改进凝聚层次聚类方法的计算出景区村落地下水生态环境监测采样簇的数目和采样簇的中心的流程图如图3所示。

301:景区村落地下水生态环境标准化度量数据矩阵的每行代表着一个景区村落地下水生态环境监测采样初始簇,即景区村落地下水生态环境标准化度量数据矩阵的n行代表着n个景区村落地下水生态环境监测采样初始簇。

302:计算得到景区村落地下水生态环境标准化度量相异度矩阵,在确定n个景区村落地下水生态环境监测采样初始簇的基础上,计算出n个景区村落地下水生态环境监测采样初始簇相互之间的明考斯基距离,表示为n个景区村落地下水生态环境监测采样初始簇相互之间的特征相异度Sij,进而得到景区村落地下水生态环境标准化度量相异度矩阵。

303:计算得到景区村落地下水生态环境监测采样簇相异度三元组,对n个景区村落地下水生态环境监测采样初始簇相互之间的特征差异度值Sij按升序进行Heap堆排序,并组成相应的景区村落地下水生态环境监测采样簇相异度三元组 (Ci, Cj, Sij),其中i≥j,且采样簇Ci和采样簇Cj的差异度为Sij

304:移除景区村落地下水生态环境监测采样簇差异度三元组中相异度排序后最大的40%的三元组,由于景区村落地下水生态环境监测指标误差的存在,且相异度高于平均值将难以在同一个景区村落地下水生态环境监测采样簇中出现,因此需要移除景区村落地下水生态环境监测采样簇相异度三元组中相异度Sij排序后最大的40%的三元组。

305:合并两个景区村落地下水生态环境监测采样簇得到新的景区村落地下水生态环境监测采样簇,取出景区村落地下水生态环境监测采样簇相异度三元组排序中最小的三元组(Ci, Cj, Sij),对其中的采样簇Ci和采样簇Cj进行合并,合并之后新的景区村落地下水生态环境监测采样簇记为簇Np,其中p初始值等于1,然后p自增1。

306:重复合并景区村落地下水生态环境监测采样簇相异度三元组排序中最小的两个采样簇,取出景区村落地下水生态环境监测采样簇相异度三元组排序中最小的三元组(Ci, Cj, Sij),对其中的采样簇Ci和采样簇Cj进行合并。如果采样簇Ci和采样簇Cj都没有出现在新簇中,那么合并采样簇Ci和采样簇Cj并组成新簇Np,p自增1如果采样簇Ci和采样簇Cj都出现在新簇Np中,执行步骤2.7;如果采样簇Ci和采样簇Cj其中一个已被合并在新簇中,则另一个采样簇也被合并到该新簇中;如果采样簇Ci和采样簇Cj分别被合并在不同的新簇中,则合并采样簇Ci和采样簇Cj并组成新簇Np,p自增1。

307:如果景区村落地下水生态环境监测采样簇相异度三元组堆排序中没有三元组,则计算结束,返回p个新的景区村落地下水生态环境监测采样簇,否则执行步骤306。

本实施例中,基于聚类的景区村落地下水生态环境监测采样点优选方法,以井冈山区域景区村落生态环境监测示范点---新干县华城门村地下水采样点的生态环境监测数据样本集为例进行实验。景区村落地下水生态环境监测数据样本集包括该示范点区域所有地下水井的监测数据,共32个采样点数据,监测指标采取的是国标《地下水质量标准》,具体包括:pH值、总硬度、硫酸盐、氯化物、铁、锰、铜、锌、挥发酚、阴离子合成洗涤剂、高锰酸盐指数、硝酸盐、亚硝酸盐、氨氮、氟化物、氰化物、汞、砷、硒、镉、铬、铅以及总大肠菌群,同时加上采样点的经度、纬度构成一个由25个属性组成的景区村落地下水生态环境数据集矩阵。需要注意的是,采样点名称和采样点编号不作为生态环境标准化度量数据矩阵其中的列。通过景区村落地下水生态环境监测数据样本集标准化处理,氰化物、汞、镉和铬4个景区村落地下水生态环境监测指标的平均值和平均绝对偏差均为0,氰化物、汞、镉和铬4个景区村落地下水生态环境监测指标代表的列从景区村落地下水的生态环境数据集矩阵移除。进而,通过改进凝聚层次聚类方法计算出景区村落地下水生态环境监测采样簇的数目和采样簇的中心,得到的采样簇有4个,分别是G1={23,26,28,29,30,31,32}、G2={21,22,24,25,27}、G3={9,10,11,13,14,15,18,19, 20}、G4={2,3,6,7}。其余的采样点作为数据孤立点有7个,分别为:1、4、5、8、12、16、17。通过计算确定采样簇G1中距离的重心最近的采样点为29(塔峰B采样点),采样簇G2中距离的重心最近的采样点为25(邓家E采样点),采样簇G3中距离的重心最近的采样点为15(菜园B采样点),采样簇G4中距离的重心最近的采样点为2(赤岗塘B采样点)。从实验结果分析,通过本发明基于聚类的景区村落地下水生态环境监测采样点优选方法,计算得到的4个景区村落地下水生态环境监测优选采样点分别来自于4个不同的村民小组,具有区域代表性,同时这4个景区村落地下水生态环境监测优选采样点无论在数据稳定性、周边环境都具有相当的代表性,反应出典型特征。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号