首页> 中国专利> 基于BP网络和基尼系数定权重的用水数据离散化方法

基于BP网络和基尼系数定权重的用水数据离散化方法

摘要

本发明公开了一种基于BP网络和基尼系数定权重的用水数据离散化方法,包括:获得基本计算单元;获得基本计算单元和行政单元空间要素数据集;对生活用水、工业用水和农业用水采用定额法补充,对生态环境用水量采用相关因子分摊法进行补充;对生态环境用水量计算公式中的权重系数采用基尼系数法确定;经过模拟计算得到基本计算单元上离散预测结果;进行结果修正;按基本计算单元的水资源分区属性逐级汇总得到相应的用水数据。本发明提出的基于BP网络和基尼系数定权重的用水数据离散化方法,可获得全国各级水资源分区经济社会及用水数据,有助于水资源综合管理。

著录项

  • 公开/公告号CN103886220A

    专利类型发明专利

  • 公开/公告日2014-06-25

    原文格式PDF

  • 申请/专利权人 北京师范大学;

    申请/专利号CN201410140946.8

  • 申请日2014-04-10

  • 分类号G06F19/00;

  • 代理机构北京风雅颂专利代理有限公司;

  • 代理人李弘

  • 地址 100875 北京市海淀区新街口外大街19号北京师范大学

  • 入库时间 2024-02-20 00:20:11

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-02-01

    授权

    授权

  • 2014-07-16

    实质审查的生效 IPC(主分类):G06F19/00 申请日:20140410

    实质审查的生效

  • 2014-06-25

    公开

    公开

说明书

技术领域

本发明涉及水利科学技术领域,特别是指一种基于BP网络和基尼系数 定权重的用水数据离散化方法。

背景技术

经济社会用水数据主要按行政单元统计而来,而其边界与水资源区边界 不重合,导致水资源区用水数据的获得十分困难。现有的经济社会用水数据 还存在共享困难、统计困难与统计数据多样等问题。利用计算机技术获得水 资源区经济社会用水数据,对于完善水资源数据基础以支撑水资源行政区域 与流域统一管理和减小人力普查投入十分重要。

用水是指为了某种经济或社会目的,使用水资源某种属性的行为,是通 过水资源开发,用水主体运用和使用已开发水资源的方式与方法的总称。经 济社会用水指采用取水、输水工程措施,从河流、湖泊、水库和地下水层将 水引至用水地区,满足城乡生产和生活需要的水量,包括生活用水、工业用 水、农业用水和生态环境用水四项。

水资源区是根据水资源的自然、社会和经济属性,按照开发、利用、治 理、配置、节约、保护要求,将流域水系划分而得来。水资源分区主要包括 水资源一级区、水资源二级区和水资源三级区。根据全国水资源分区标准, 水资源一级区主要包括我国境内的10个大型流域,将各个水资源一级区细分 为水资源二级区,各二级区再细分为水资源三级区。由于水资源区与行政区 边界不重叠,导致一个县级行政区被多个水资源三级区分割。目前,按各级 水资源分区统计的用水数据十分匮乏。

综上所述,提出一种可靠的经济社会用水数据统计方法,以获得各水资 源区上用水数据的分布情况是急待解决的问题。

发明内容

有鉴于此,本发明的目的在于提出一种基于BP网络和基尼系数定权重 的用水数据离散化方法,以获得各水资源区上用水数据的分布情况,从而获 得全国各级水资源分区经济社会及用水数据,有助于水资源综合管理。

基于上述目的本发明提供的基于BP网络和基尼系数定权重的用水数据 离散化方法,包括:

将县级行政区与水资源三级区矢量图进行叠加嵌套,获得每个县级行政 单元所属不同水资源三级区部分的基本空间单元,作为基本计算单元;

将各类土地利用数据和DEM数据统计到各基本计算单元和行政单元空 间上,获得基本计算单元和行政单元空间要素数据集;

根据各级行政单元经济社会用水数据,对县级行政单元生活用水、工业 用水和农业用水采用定额法补充,对生态环境用水量采用相关因子分摊法进 行补充;

对生态环境用水量采用相关因子分摊法进行补充得到的计算公式中的权 重系数采用基尼系数法确定;

基于BP人工神经网络模型,利用数据指标间相关关系,经过模拟计算 得到基本计算单元上离散预测值,从而将县级行政单元经济社会用水数据展 布到基本计算单元上;

以各基本计算单元预测值作为权重由所属县级行政单元总值向下分摊进 行结果修正;

将修正后的经济社会和用水数据值,按基本计算单元的水资源分区属性 逐级汇总得到相应的用水数据。

在一些实施方式中,所述将县级行政区与水资源三级区矢量图进行叠加 嵌套,获得每个县级行政单元所属不同水资源三级区部分的基本空间单元, 作为基本计算单元的步骤包括:

采用地理信息系统软件Arc GIS,对县级行政区与水资源三级区矢量图进 行叠加嵌套,获得每个县级行政单元所属不同水资源三级区部分的基本空间 单元,作为基本计算单元;

将小于所在县级行政区面积10%的基本计算单元向邻近面积最大的基本 计算单元合并。

在一些实施方式中,所述将各类土地利用数据和DEM数据统计到各基 本计算单元和行政单元空间上,获得基本计算单元和行政单元空间要素数据 集的步骤包括:

利用获得基本计算单元矢量图和包括各类土地利用数据和DEM数据的 空间数据,基于Arc GIS区域统计(Zonal Statistics)模块,将各类土地利用 数据和DEM数据统计到各基本计算单元上;

利用行政区单元矢量图统计获得各级行政单元各类土地利用和DEM数 据;

获得基本计算单元和行政单元空间要素数据集,用于空间离散化分析。

在一些实施方式中,所述基于BP人工神经网络模型,利用数据指标间 相关关系,经过模拟计算得到基本计算单元上离散预测值,从而将县级行政 单元经济社会用水数据展布到基本计算单元上的步骤包括:

根据人工神经网络理论,构建经济社会用水数据空间离散化BP人工神 经网络三层网络拓扑结构;数据空间离散化神经网络包括输入层、隐含层和 输出层三层;

影响指标数据作为自变量进入输入层,同时影响指标向量维数决定了输 入层节点的个数m,输出层节点数n,即为模拟的因变量的结果;隐含层的 输出函数为Sigmoid变换函数,输入和输出函数为线性函数;

正向传播过程中,输入信息从输入层经隐含层逐层处理,每一层节点的 状态只影响下一层节点的状态;如果在输出层不能得到期望的输出,则转入 反向传播,将误差信号沿原来的连接通路返回,通过修改各层节点的权值, 使误差最小;

将任意2/3的数据样本进行训练学习,模拟因变量与其相关的自变量间 复杂的非线性关系;

将另外1/3的样本作为验证数据,以验证训练学习效果;

分别计算训练学习阶段和验证阶段模拟结果与实测样本间的相关系数 R12和R22,当两者均大于常数α(0<α<1)时认为训练效果合格,取 α=0.7~0.8;

以验证合格的神经网络预测模型,输入基本计算单元上与因变量相关的 自变量指标数据,经过模拟计算得到基本计算单元上离散预测结果。

在一些实施方式中,所述以各基本计算单元预测值作为权重由所属县级 行政单元总值向下分摊进行结果修正的步骤包括:

采用计算公式进行修正;

其中:为神经网络模型预测得到经济社会以及用水指标在基本计 算单元i上的值;为基本计算单元i所属县级行政单元上经修正后的数 据值;为修正后的基本计算单元i的数据值。

在一些实施方式中,所述将修正后的经济社会和用水数据值,按基本计 算单元的水资源分区属性逐级汇总得到相应的用水数据的步骤包括:

采用计算公式

其中:为修正后的基本计算单元i的数据值;为基本计算单元 i所属水资源三级区j对应指标数据值;为水资源三级区j所属水资源 二级区k对应指标数据值;为水资源二级区k所属水资源一级区l对 应指标数据值。

在一些实施方式中,所述对生态环境用水量采用相关因子分摊法进行补 充的步骤包括:

生态环境用水需求的影响因素包括林地、草地、水域、城镇用地、GDP 和非农业人口,各级行政单元生态环境用水量计算公式为

其中:ki(i=1,2,3,4,5,6)为权重系数;为行政单元i生态环境 用水量,计算单位为亿m3;为上一级行政单元生态环境用水量,计 算单位为亿m3;为行政单元i林地面积,计算单位为kha;为上一级行政单元林地面积,计算单位为kha;为行政单元i草地面 积,计算单位为kha;为上一级行政单元草地面积,计算单位为 kha;为行政单元i水域面积,计算单位为kha;为上一级行 政单元水域面积,计算单位为kha;为行政单元i城镇用地面积,计 算单位为kha;为上一级行政单元城镇用地面积,计算单位为kha; GDPi为行政单元i国民生产总值,计算单位为万元;GDP为上一级行政 单元国民生产总值,计算单位为万元;为行政单元i非农业人口数, 计算单位为万人;为上一级行政单元非农业人口数,计算单位为万 人。

在一些实施方式中,所述对生态环境用水量采用相关因子分摊法进行补 充得到的计算公式中的权重系数采用基尼系数法确定的步骤包括:

对各指标样本数据进行归一化处理,计算公式为

式中:Yki为第k个指标的第i个样本数据归一化后的值;Vki为第k个 指标的第i个样本数据;

评价指标基尼系数值,

当指标归一化样本的均值不为0时,计算公式为:

当指标归一化样本的均值为0时,

其中:Gk为第k个指标的基尼系数值;n为指标的数据总数;μk为第 k个指标所有归一化样本的期望值;

基于计算获得的基尼系数值计算获得基尼系数权重,计算公式为 gk=GkΣi=1mGi,

其中:gk为第k个指标的基尼系数权重;Gk为第k个指标的基尼系数 值,m为指标个数。计算所得gk即为生态环境用水量补充权重系数Kk(k=1,2,3,4,5,6)。

在一些实施方式中,所述对生态环境用水量采用相关因子分摊法进行补 充得到的计算公式中的权重系数采用基尼系数法确定的步骤还包括:

在补充后数据的基础上,以下级行政单元值作为权重由上级行政单元总 值逐级向下分摊进行数据补充,计算公式为

其中:为上一级数据修正后的数据总值,全国总数不作修正;为修正后的行政单元i的数据值;为行政单元i的原始数据值;修正后的 数据特征为:全国总值等于各省之和,各省总值等于其下各市之和,各市总 值等于其下各区县之和。

在一些实施方式中,所述对县级行政单元生活用水、工业用水和农业用 水采用定额法补充的步骤包括:

对县级行政单元生活用水量的补充:

假设上一级行政区单元生活用水综合定额与其下一级行政单元生活用水 综合定额相同,并满足计算公式

其中:为行政单元i当年生活用水量,计算单位为亿m3;Ni为行 政单元i当年用水人口数,计算单位为万人;为行政单元i的上级行政 单元当年人均生活用水综合定额,计算单位为L/人·d;为行政单元i的 上级行政单元当年生活用水量,计算单位为亿m3;N为行政单元i的上级 行政单元当年用水人口数,计算单位为万人;

对县级行政单元工业用水量的补充:

以工业增加值作为用水定额主要影响因素,假设上一级行政区单元工业 用水定额与其下一级行政单元工业用水综合定额相等,并满足计算公式

其中:为行政单元i当年工业用水量,计算单位为亿m3;为 行政单元i当年工业增加值,计算单位为万元;为行政单元i的上级行政 单元当年万元工业增加值用水量,计算单位为亿m3/万元;为行政单元i 的上级行政单元当年工业用水总量,计算单位为亿m3;为行政单元i的 上级行政单元当年工业增加值,计算单位为万元;

对县级行政单元农业用水量的补充:

在上级行政单元降水、蒸发及其他灌溉技术水平一定的条件下,假设下 级行政单元作物灌溉强度与相应上级行政单元相同,由灌溉面积计算下级行 政单元农业用水量,并满足计算公式

其中:为行政单元i农业用水量,计算单位为亿m3;为行政 单元i农业灌溉面积,计算单位为kha;为上一级行政单元单位面积农 业灌溉用水量,计算单位为亿m3/kha;为上级行政单元农业用水量, 计算单位为亿m3;为上级行政单元灌溉面积,计算单位为kha。

从上面所述可以看出,本发明提供的基于BP网络和基尼系数定权重的 用水数据离散化方法,通过精确划分基本计算单元并进行相应数据统计、然 后进行数据预处理、进一步进行空间离散化、最后采用结果修正和数据汇总 完成数据后处理的方法,获得了全国各级水资源分区经济社会及用水数据, 有助于水资源综合管理;并且该方法适用于各级行政单元经济社会数据与用 水数据空间离散化处理,其数据结果质量高,从而减小了水资源分区用水数 据人力普查工作量和相关投入。

附图说明

图1为本发明提供的基于BP网络和基尼系数定权重的用水数据离散化 方法的一个实施例的流程示意图;

图2为本发明提供的基于BP网络和基尼系数定权重的用水数据离散化 方法的另一实施例的流程示意图;

图3为本发明提供的基于BP网络和基尼系数定权重的用水数据离散化 方法实施例中基本计算单元划分的示意图;

图4为本发明提供的基于BP网络和基尼系数定权重的用水数据离散化 方法实施例中数据空间离散化模型神经网络拓扑结构示意图;

图5为本发明提供的基于BP网络和基尼系数定权重的用水数据离散化 方法实施例中基于BP神经网络的空间离散化模型构架示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施 例,并参照附图,对本发明进一步详细说明。

需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均 是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第 二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对 此不再一一说明。

参照附图1,为本发明提供的基于BP网络和基尼系数定权重的用水数据 离散化方法的一个实施例的流程示意图。

所述基于BP网络和基尼系数定权重的用水数据离散化方法,包括:

步骤101:将县级行政区与水资源三级区矢量图进行叠加嵌套,获得每 个县级行政单元所属不同水资源三级区部分的基本空间单元,作为基本计算 单元;

步骤102:将各类土地利用数据和DEM数据统计到各基本计算单元和行 政单元空间上,获得基本计算单元和行政单元空间要素数据集;

步骤103:根据各级行政单元经济社会用水数据,对县级行政单元生活 用水、工业用水和农业用水采用定额法补充,对生态环境用水量采用相关因 子分摊法进行补充;

步骤104:对生态环境用水量采用相关因子分摊法进行补充得到的计算 公式中的权重系数采用基尼系数法确定;

步骤105:基于BP人工神经网络模型,利用数据指标间相关关系,经过 模拟计算得到基本计算单元上离散预测值,从而将县级行政单元经济社会用 水数据展布到基本计算单元上;

步骤106:以各基本计算单元预测值作为权重由所属县级行政单元总值 向下分摊进行结果修正;

步骤107:将修正后的经济社会和用水数据值,按基本计算单元的水资 源分区属性逐级汇总得到相应的用水数据。

参照附图2,为本发明提供的基于BP网络和基尼系数定权重的用水数据 离散化方法的另一实施例的流程示意图。

所述基于BP网络和基尼系数定权重的用水数据离散化方法包括:

步骤100:基础数据收集;

步骤200:计算单元划分与数据统计;

步骤300:数据预处理;

步骤400:空间离散化;

步骤500:数据后处理。

进一步的,所述步骤200——计算单元划分与数据统计,主要是指按水 资源区划的原则将行政分区单元分割成分辨率更高的具有水资源分区属性的 空间单元,作为空间离散化的基本计算单元;然后对基本计算单元上空间要 素进行统计分析。具体地,还可包括下述步骤:

步骤201:在地理信息系统软件Arc GIS中利用“intersect”命令对县级 行政区与水资源三级区矢量图进行叠加嵌套(参照附图3);

步骤202:获得每个县级行政单元所属不同水资源三级区部分的基本空 间单元,即为基本计算单元;

同时,还可对小于所在县级行政区面积10%的基本计算单元进一步处 理,将其向邻近面积最大的基本计算单元合并。

步骤203:利用获得基本计算单元矢量图和空间数据(DEM和MODIS 土地利用),基于Arc GIS区域统计(Zonal Statistics)模块,将各类土地利用 数据和DEM数据统计到各基本计算单元上;

同时,利用行政区单元矢量图同样统计获得各级行政单元各类土地利用 和DEM数据;

从而获得基本计算单元和行政单元空间要素数据集,用于空间离散化分 析。

较佳的,所述步骤300——数据预处理:主要指在尽最大努力获取基础 数据前提下,对可能存在的行政单元经济社会用水数据缺失问题,采用合理 的分析算法进行补充;对统计数据多样问题,采用自上级向下级分摊方式进 行修正。最终获得一套完整且配套的各级行政单元经济社会用水基础数据 集。具体地,还可包括下述步骤:

步骤301:数据补充:根据各级行政单元经济社会用水数据,对县级行 政单元生活用水、工业用水和农业用水采用定额法补充,对生态环境用水量 采用相关因子分摊法进行补充。补充方法如下:

(1)生活用水量补充

生活用水量的重要影响因子是人口数。一个区域的生活用水量与其总人 口数存正相关关系。而由于统计数据本身的缺失,对于本地区当年生活用水 综合定额无法计算得到。因此,假设上一级行政区单元生活用水综合定额与 其下一级行政单元生活用水综合定额相同,即满足下式:

式中:为行政单元i当年生活用水量,单位为亿m3;Ni为行政单 元i当年用水人口数,计算单位为万人;为行政单元i的上级行政单元 当年人均生活用水综合定额,计算单位为L/人·d;为行政单元i的上级 行政单元当年生活用水量,计算单位为亿m3;N为行政单元i的上级行政 单元当年用水人口数,计算单位为万人。

(2)工业用水量补充

以工业增加值作为用水定额主要影响因素,假设上一级行政区单元工业 用水定额与其下一级行政单元工业用水综合定额相等,即满足下式:

式中:为行政单元i当年工业用水量,计算单位为亿m3;为 行政单元i当年工业增加值,计算单位为万元;为行政单元i的上级行政 单元当年万元工业增加值用水量,计算单位为亿m3/万元;为行政单元i 的上级行政单元当年工业用水总量,计算单位为亿m3;为行政单元i的 上级行政单元当年工业增加值,计算单位为万元。

(3)农业用水量补充

在上级行政单元降水、蒸发及其他灌溉技术水平一定的条件下,假设下 级行政单元作物灌溉强度与相应上级行政单元相同,可由灌溉面积计算下级 行政单元农业用水量:

式中:为行政单元i农业用水量,计算单位为亿m3;为行政 单元i农业灌溉面积,kha;为上一级行政单元单位面积农业灌溉用水 量,亿m3/kha;为上级行政单元农业用水量,计算单位为亿m3;为上级行政单元灌溉面积,kha。

(4)生态环境用水量补充

生态环境用水量,与经济发展状况密切相关。随着经济社会的发展,生 态环境用水需求增加,其主要影响因素包括林地、草地、水域、城镇用地、 GDP和非农业人口。各级行政单元生态环境用水量计算如下:

式中:ki(i=1,2,3,4,5,6)为权重系数;为行政单元i生态环境 用水量,计算单位为亿m3;为上一级行政单元生态环境用水量,计 算单位为亿m3;为行政单元i林地面积,计算单位为kha;为上一级行政单元林地面积,计算单位为kha;为行政单元i草地面 积,计算单位为kha;为上一级行政单元草地面积,计算单位为 kha;为行政单元i水域面积,计算单位为kha;为上一级行 政单元水域面积,计算单位为kha;为行政单元i城镇用地面积,计 算单位为kha;为上一级行政单元城镇用地面积,计算单位为kha; GDPi为行政单元i国民生产总值,计算单位为万元;GDP为上一级行政 单元国民生产总值,计算单位为万元;为行政单元i非农业人口数, 计算单位为万人;为上一级行政单元非农业人口数,计算单位为万 人。

进一步的,对于公式(4)中的权重系数,采用基尼系数法来确定,具体 确定方法如下:

基尼系数(Gini Coefficient)是一个定量测定收入分配差异程度的指标, 是用来综合考察居民内部收入分配差异状况的一个重要分析指标。此处采用 基尼系数赋权法,通过计算评价指标基尼系数值大小,以反映该指标不同评 价对象之间的数据差异的大小。具体计算过程如下:

首先,对各指标样本数据进行归一化处理,计算公式如下:

Yki=VkiΣi=1nVki---(5)

式中:Yki为第k个指标的第i个样本数据归一化后的值;Vki为第k个 指标的第i个样本数据。

评价指标基尼系数值计算如下式所示:

Gk=Σi=1nΣj=1n|Yki-Ykj|2n2μk---(6)

Gk=Σi=1nΣj=1n|Yki-Ykj|n2-n---(7)

式(6)和(7)中:Gk为第k个指标的基尼系数值;n为指标的数据总 数;μk为第k个指标所有归一化样本的期望值。当指标归一化样本的均值 不为0时,指标的基尼系数值采用公式(6)计算;而当其均值为0时,采用 公式(7)计算。

基于计算获得的基尼系数值可计算获得基尼系数权重,公式如下:

gk=GkΣi=1mGi---(8)

其中:gk为第k个指标的基尼系数权重;Gk为第k个指标的基尼系数 值,m为指标个数。计算所得gk即为生态环境用水量补充权重系数Kk(k=1,2,3,4,5,6)。

步骤302:数据修正:考虑各级行政单元可能存在统计口径不一的问 题,在补充后数据的基础上,以下级行政单元值作为权重由上级行政单元总 值逐级向下分摊,如下式所示:

式中:为上一级数据修正后的数据总值,全国总数不作修正;为修正后的行政单元i的数据值;为行政单元i的原始数据值。修正后的 数据特征为:全国总值等于各省之和,各省总值等于其下各市之和,各市总 值等于其下各区县之和。

进一步的,所述步骤400——空间离散化:主要是指在数据预处理所得 相关基础数据的基础上,基于BP人工神经网络模型,利用数据指标间相关 关系,进行模拟预测将县级行政单元经济社会用水数据展布到基本计算单元 上的过程。具体地,基于BP人工神经网络模型的经济社会用水数据空间离 散化方法,还可进一步包括下述步骤:

步骤401:根据人工神经网络理论,构建经济社会用水数据空间离散化 BP人工神经网络三层网络拓扑结构(参照附图4)。数据空间离散化神经网 络包括输入层、隐含层和输出层三层。影响指标数据作为自变量进入输入 层,同时影响指标向量维数决定了输入层节点的个数m,输出层节点数n, 即模拟的因变量的结果。隐含层的输出函数为Sigmoid变换函数,输入和输 出函数为线性函数。正向传播过程中,输入信息从输入层经隐含层逐层处 理,每一层节点的状态只影响下一层节点的状态。如果在输出层不能得到期 望的输出,则转入反向传播,将误差信号沿原来的连接通路返回,通过修改 各层节点的权值,使误差最小。BP人工神经网络具有极强的模拟分析与预测 能力,保证了空间离散化数据成果的质量。

步骤402:基于BP人工神经网络模型,经济社会用水数据模拟预测流程 见图5所示。模拟过程中,将任意2/3的数据样本进行训练学习,模拟因变 量与其相关的自变量间复杂的非线性关系;同时,将另外1/3的样本作为验 证数据,以验证训练学习效果。分别计算训练学习阶段和验证阶段模拟结果 与实测样本间的相关系数R12和R22,当两者均大于常数α(0<α<1)时认为 训练效果合格,一般取α=0.7~0.8。最后,以验证合格的神经网络预测模型, 输入基本计算单元上与因变量相关的自变量指标数据,经过模拟计算得到基 本计算单元上离散预测结果。

因BP人工神经网络模型预测输出到基本计算单元的数值并非与行政单 元数据相匹配,进一步的,所述步骤500——数据后处理,具体包括:进一 步修正预测数据结果,并按基本计算单元的水资源分区属性进一步汇总统 计,得到各水资源区分布情况。具体包括以下步骤:

步骤501:结果修正:以各基本计算单元预测值作为权重由所属县级行 政单元总值向下分摊修正,如下式所示。

式中:为神经网络模型预测得到经济社会以及用水指标在基本计 算单元i上的值;为基本计算单元i所属县级行政单元上经修正后的数 据值;为修正后的基本计算单元i的数据值。

步骤502:各级水资源分区用水数据汇总:将修正后的经济社会和用水 数据值,按基本计算单元的水资源分区属性逐级汇总,计算表达式如下:

式中:为修正后的基本计算单元i的数据值;为基本计算单元 i所属水资源三级区j对应指标数据值;为水资源三级区j所属水资源 二级区k对应指标数据值;为水资源二级区k所属水资源一级区l对 应指标数据值。

为了更清楚本发明提供的方法能够如何应用,下面结合方法应用实施例 进行说明:

结合参照附图1和附图2,所述方法用于经济社会用水空间离散化的主 要思想为:首先,利用空间数据和GIS技术进行空间计算单元的划分,确定 数据离散化的基本计算单元,并统计获得基本计算单元和行政分区单元相关 的空间要素数据。同时,利用各级行政单元的经济社会数据、空间要素数据 和用水数据,进行经济社会用水数据补充和修正,形成一套完整的行政分区 基础数据集。然后,基于县级行政区和基本计算单元的基础数据,并考虑数 据指标间相关关系,利用BP人工神经网络模型先后将经济社会数据和用水 数据向基本计算单元空间离散化。最后,参考各县级行政区数据,将离散得 到预测值进一步修正处理,并按水资源分区汇总用水数据结果,得到水资源 一级区、水资源二级区和水资源三级区经济社会用水数据离散结果。

该方法不仅能将用水数据空间离散到各级水资源区上,还可将相关经济 社会数据离散展布到水资源区单元上。以下对各处理步骤进行详细描述:

基础数据收集。根据经济社会用水数据同化与空间离散化的要求,需首 先收集基础分析数据,主要包括:空间数据和各级(省、市、县)行政单元 经济社会数据与用水数据,如表1所示。其中,空间数据和各级行政单元经 济社会数据应是完善的,而各级行政单元用水数据则可能存在数据缺失和统 计数据多样的问题。

表1 基础数据体系

计算单元划分。根据图1或图2所示流程,利用收集得到的县级行政单 元和水资源三级区矢量图,进行Arc GIS矢量图叠套,获得基本计算单元分 布矢量图。

空间数据统计。利用所得基本计算单元矢量图以及DEM和MODIS土地 利用,基于Arc GIS区域统计模块统计得到各县级行政单元和基本计算单元 DEM数据(包括海拔和坡度)与六种土地利用数据(见表1),为BP人工神 经网络的模拟预测作数据准备。

用水数据补充。如在收集到的基础数据中,行政单元经济社会用水数据 存在缺失的问题,那么根据公式(1)~(3)分别计算补充完善各级行政单元 生活、工业和农业用水数据。根据公式(5)~(8),以各省级行政单元分 组,先后对每个省份下所有县级行政单元的林地、草地、水域和城镇用地面 积(由第三步获得)以及GDP和非农业人口数据进行归一化处理,并计算各 省级行政单元内生态用水量补充需的基尼权重系数。最后根据公式(4),计 算并补充完善各县级行政单元生态环境用水量。

数据修正。根据经济社会用水数据修正算法(见公式(9)),将补充完善 后的各级行政单元基础数据进一步修正,获得上下级匹配的经济社会用水数 据集。

BP人工神经网络模拟预测。在前述数据准备完成后,基于BP人工神经 网络模型进行经济社会用水数据模拟预测,参照附图5。为尽量减小地区差 异性对模拟训练和离散预测效果的影响,分别按水资源一级区分组进行训练 模拟和离散预测分析——输入的训练样本主要来自单个水资源一级区所涉及 县级行政单元的指标数据样本。考虑到地空间要素指标、经济社会指标与用 水指标三者之间的相关关系,建立用水数据空间离散化神经网络模拟预测指 标体系,自变量与因变量指标如表2所示。在此基础上构建经济社会用水数 据空间离散化流程:首先将县级行政单元的空间要素指标(海拔、坡度、土 地利用)作为自变量,经济社会指标(人口、经济、农业生产)为因变量, 进行神经网络训练,验证合格后输入基本计算单元上海拔、坡度、土地利用 数据将经济社会数据离散预测到基本计算单元上;再以同样的方式,将空间 要素指标和经济社会指标作为自变量,经济社会用水指标为因变量,将用水 数据离散到基本计算单元上。最终,离散获得基本计算单元经济社会数据和 经济社会用水数据的模拟预测值。

表2 用水数据空间离散化神经网络模拟指标体系

自变量指标 因变量指标 海拔、坡度、土地利用类 人口类、经济类、农业生产类 海拔、坡度、土地利用类、人口类、经济类、农业生产类 生活用水量、工业用水量、农业用水量、生态环境用水量

结果修正。根据公式(10),将第六步离散预测得到的基本计算单元经济 社会数据和经济社会用水数据进一步修正处理,获得与县级行政单元相匹配 的数据集。

各级水资源分区用水数据汇总。根据公式(11),对第七步得到的基本计 算单元数据结果分逐级汇总,获得各水资源分区上经济社会与经济社会用水 数据。

从上面所述可以看出,本发明提供的基于BP网络和基尼系数定权重的 用水数据离散化方法,通过精确划分基本计算单元并进行相应数据统计、然 后进行数据预处理、进一步进行空间离散化、最后采用结果修正和数据汇总 完成数据后处理的方法,获得了全国各级水资源分区经济社会及用水数据, 有助于水资源综合管理;并且该方法适用于各级行政单元经济社会数据与用 水数据空间离散化处理,其数据结果质量高,从而减小了水资源分区用水数 据人力普查工作量和相关投入。

所属领域的普通技术人员应当理解:以上所述仅为本发明的具体实施例 而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修 改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号