首页> 中国专利> 基于BP网络和基尼系数定权重的用水数据离散化方法

基于BP网络和基尼系数定权重的用水数据离散化方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明公开了一种基于BP网络和基尼系数定权重的用水数据离散化方法，包括：获得基本计算单元；获得基本计算单元和行政单元空间要素数据集；对生活用水、工业用水和农业用水采用定额法补充，对生态环境用水量采用相关因子分摊法进行补充；对生态环境用水量计算公式中的权重系数采用基尼系数法确定；经过模拟计算得到基本计算单元上离散预测结果；进行结果修正；按基本计算单元的水资源分区属性逐级汇总得到相应的用水数据。本发明提出的基于BP网络和基尼系数定权重的用水数据离散化方法，可获得全国各级水资源分区经济社会及用水数据，有助于水资源综合管理。

著录项

公开/公告号CN103886220A

专利类型发明专利
公开/公告日2014-06-25

原文格式PDF
申请/专利权人北京师范大学;
展开▼

申请/专利号CN201410140946.8
发明设计人许新宜;杨中文;鱼京善;王红瑞;孙文超;陈华鑫;宾零陵;
展开▼

申请日2014-04-10
分类号G06F19/00;
代理机构北京风雅颂专利代理有限公司;
代理人李弘
地址 100875 北京市海淀区新街口外大街19号北京师范大学
入库时间 2024-02-20 00:20:11

法律信息

法律状态公告日

法律状态信息

法律状态
2017-02-01

授权

授权
2014-07-16

实质审查的生效 IPC(主分类):G06F19/00 申请日:20140410

实质审查的生效
2014-06-25

公开

公开

说明书

技术领域

本发明涉及水利科学技术领域，特别是指一种基于BP网络和基尼系数定权重的用水数据离散化方法。

背景技术

经济社会用水数据主要按行政单元统计而来，而其边界与水资源区边界不重合，导致水资源区用水数据的获得十分困难。现有的经济社会用水数据还存在共享困难、统计困难与统计数据多样等问题。利用计算机技术获得水资源区经济社会用水数据，对于完善水资源数据基础以支撑水资源行政区域与流域统一管理和减小人力普查投入十分重要。

用水是指为了某种经济或社会目的，使用水资源某种属性的行为，是通过水资源开发，用水主体运用和使用已开发水资源的方式与方法的总称。经济社会用水指采用取水、输水工程措施，从河流、湖泊、水库和地下水层将水引至用水地区，满足城乡生产和生活需要的水量，包括生活用水、工业用水、农业用水和生态环境用水四项。

水资源区是根据水资源的自然、社会和经济属性，按照开发、利用、治理、配置、节约、保护要求，将流域水系划分而得来。水资源分区主要包括水资源一级区、水资源二级区和水资源三级区。根据全国水资源分区标准，水资源一级区主要包括我国境内的10个大型流域，将各个水资源一级区细分为水资源二级区，各二级区再细分为水资源三级区。由于水资源区与行政区边界不重叠，导致一个县级行政区被多个水资源三级区分割。目前，按各级水资源分区统计的用水数据十分匮乏。

综上所述，提出一种可靠的经济社会用水数据统计方法，以获得各水资源区上用水数据的分布情况是急待解决的问题。

发明内容

有鉴于此，本发明的目的在于提出一种基于BP网络和基尼系数定权重的用水数据离散化方法，以获得各水资源区上用水数据的分布情况，从而获得全国各级水资源分区经济社会及用水数据，有助于水资源综合管理。

基于上述目的本发明提供的基于BP网络和基尼系数定权重的用水数据离散化方法，包括：

将县级行政区与水资源三级区矢量图进行叠加嵌套，获得每个县级行政单元所属不同水资源三级区部分的基本空间单元，作为基本计算单元；

将各类土地利用数据和DEM数据统计到各基本计算单元和行政单元空间上，获得基本计算单元和行政单元空间要素数据集；

根据各级行政单元经济社会用水数据，对县级行政单元生活用水、工业用水和农业用水采用定额法补充，对生态环境用水量采用相关因子分摊法进行补充；

对生态环境用水量采用相关因子分摊法进行补充得到的计算公式中的权重系数采用基尼系数法确定；

基于BP人工神经网络模型，利用数据指标间相关关系，经过模拟计算得到基本计算单元上离散预测值，从而将县级行政单元经济社会用水数据展布到基本计算单元上；

以各基本计算单元预测值作为权重由所属县级行政单元总值向下分摊进行结果修正；

将修正后的经济社会和用水数据值，按基本计算单元的水资源分区属性逐级汇总得到相应的用水数据。

在一些实施方式中，所述将县级行政区与水资源三级区矢量图进行叠加嵌套，获得每个县级行政单元所属不同水资源三级区部分的基本空间单元，作为基本计算单元的步骤包括：

采用地理信息系统软件Arc GIS，对县级行政区与水资源三级区矢量图进行叠加嵌套，获得每个县级行政单元所属不同水资源三级区部分的基本空间单元，作为基本计算单元；

将小于所在县级行政区面积10%的基本计算单元向邻近面积最大的基本计算单元合并。

在一些实施方式中，所述将各类土地利用数据和DEM数据统计到各基本计算单元和行政单元空间上，获得基本计算单元和行政单元空间要素数据集的步骤包括：

利用获得基本计算单元矢量图和包括各类土地利用数据和DEM数据的空间数据，基于Arc GIS区域统计（Zonal Statistics）模块，将各类土地利用数据和DEM数据统计到各基本计算单元上；

利用行政区单元矢量图统计获得各级行政单元各类土地利用和DEM数据；

获得基本计算单元和行政单元空间要素数据集，用于空间离散化分析。

在一些实施方式中，所述基于BP人工神经网络模型，利用数据指标间相关关系，经过模拟计算得到基本计算单元上离散预测值，从而将县级行政单元经济社会用水数据展布到基本计算单元上的步骤包括：

根据人工神经网络理论，构建经济社会用水数据空间离散化BP人工神经网络三层网络拓扑结构；数据空间离散化神经网络包括输入层、隐含层和输出层三层；

影响指标数据作为自变量进入输入层，同时影响指标向量维数决定了输入层节点的个数m，输出层节点数n，即为模拟的因变量的结果；隐含层的输出函数为Sigmoid变换函数，输入和输出函数为线性函数；

正向传播过程中，输入信息从输入层经隐含层逐层处理，每一层节点的状态只影响下一层节点的状态；如果在输出层不能得到期望的输出，则转入反向传播，将误差信号沿原来的连接通路返回，通过修改各层节点的权值，使误差最小；

将任意2/3的数据样本进行训练学习，模拟因变量与其相关的自变量间复杂的非线性关系；

将另外1/3的样本作为验证数据，以验证训练学习效果；

分别计算训练学习阶段和验证阶段模拟结果与实测样本间的相关系数 R1²和R2²，当两者均大于常数α（0<α<1）时认为训练效果合格，取 α=0.7～0.8；

以验证合格的神经网络预测模型，输入基本计算单元上与因变量相关的自变量指标数据，经过模拟计算得到基本计算单元上离散预测结果。

在一些实施方式中，所述以各基本计算单元预测值作为权重由所属县级行政单元总值向下分摊进行结果修正的步骤包括：

采用计算公式进行修正；

其中：为神经网络模型预测得到经济社会以及用水指标在基本计算单元i上的值；为基本计算单元i所属县级行政单元上经修正后的数据值；为修正后的基本计算单元i的数据值。

在一些实施方式中，所述将修正后的经济社会和用水数据值，按基本计算单元的水资源分区属性逐级汇总得到相应的用水数据的步骤包括：

采用计算公式

其中：为修正后的基本计算单元i的数据值；为基本计算单元 i所属水资源三级区j对应指标数据值；为水资源三级区j所属水资源二级区k对应指标数据值；为水资源二级区k所属水资源一级区l对应指标数据值。

在一些实施方式中，所述对生态环境用水量采用相关因子分摊法进行补充的步骤包括：

生态环境用水需求的影响因素包括林地、草地、水域、城镇用地、GDP 和非农业人口，各级行政单元生态环境用水量计算公式为

其中：k_i(i=1,2,3,4,5,6)为权重系数；为行政单元i生态环境用水量，计算单位为亿m³；为上一级行政单元生态环境用水量，计算单位为亿m³；为行政单元i林地面积，计算单位为kha；为上一级行政单元林地面积，计算单位为kha；为行政单元i草地面积，计算单位为kha；为上一级行政单元草地面积，计算单位为 kha；为行政单元i水域面积，计算单位为kha；为上一级行政单元水域面积，计算单位为kha；为行政单元i城镇用地面积，计算单位为kha；为上一级行政单元城镇用地面积，计算单位为kha； GDPⁱ为行政单元i国民生产总值，计算单位为万元；GDP^上为上一级行政单元国民生产总值，计算单位为万元；为行政单元i非农业人口数，计算单位为万人；为上一级行政单元非农业人口数，计算单位为万人。

在一些实施方式中，所述对生态环境用水量采用相关因子分摊法进行补充得到的计算公式中的权重系数采用基尼系数法确定的步骤包括：

对各指标样本数据进行归一化处理，计算公式为

式中：Y_ki为第k个指标的第i个样本数据归一化后的值；V_ki为第k个指标的第i个样本数据；

评价指标基尼系数值，

当指标归一化样本的均值不为0时，计算公式为：

当指标归一化样本的均值为0时，

其中：G_k为第k个指标的基尼系数值；n为指标的数据总数；μ_k为第 k个指标所有归一化样本的期望值；

基于计算获得的基尼系数值计算获得基尼系数权重，计算公式为 $g_{k} = \frac{G_{k}}{Σ_{i = 1}^{m} G_{i}},$

其中：g_k为第k个指标的基尼系数权重；G_k为第k个指标的基尼系数值，m为指标个数。计算所得g_k即为生态环境用水量补充权重系数K_k（k=1,2,3,4,5,6）。

在一些实施方式中，所述对生态环境用水量采用相关因子分摊法进行补充得到的计算公式中的权重系数采用基尼系数法确定的步骤还包括：

在补充后数据的基础上，以下级行政单元值作为权重由上级行政单元总值逐级向下分摊进行数据补充，计算公式为

其中：为上一级数据修正后的数据总值，全国总数不作修正；为修正后的行政单元i的数据值；为行政单元i的原始数据值；修正后的数据特征为：全国总值等于各省之和，各省总值等于其下各市之和，各市总值等于其下各区县之和。

在一些实施方式中，所述对县级行政单元生活用水、工业用水和农业用水采用定额法补充的步骤包括：

对县级行政单元生活用水量的补充：

假设上一级行政区单元生活用水综合定额与其下一级行政单元生活用水综合定额相同，并满足计算公式

其中：为行政单元i当年生活用水量，计算单位为亿m³；Nⁱ为行政单元i当年用水人口数，计算单位为万人；为行政单元i的上级行政单元当年人均生活用水综合定额，计算单位为L/人·d；为行政单元i的上级行政单元当年生活用水量，计算单位为亿m³；N^上为行政单元i的上级行政单元当年用水人口数，计算单位为万人；

对县级行政单元工业用水量的补充：

以工业增加值作为用水定额主要影响因素，假设上一级行政区单元工业用水定额与其下一级行政单元工业用水综合定额相等，并满足计算公式

其中：为行政单元i当年工业用水量，计算单位为亿m³；为行政单元i当年工业增加值，计算单位为万元；为行政单元i的上级行政单元当年万元工业增加值用水量，计算单位为亿m³/万元；为行政单元i 的上级行政单元当年工业用水总量，计算单位为亿m³；为行政单元i的上级行政单元当年工业增加值，计算单位为万元；

对县级行政单元农业用水量的补充：

在上级行政单元降水、蒸发及其他灌溉技术水平一定的条件下，假设下级行政单元作物灌溉强度与相应上级行政单元相同，由灌溉面积计算下级行政单元农业用水量，并满足计算公式

其中：为行政单元i农业用水量，计算单位为亿m³；为行政单元i农业灌溉面积，计算单位为kha；为上一级行政单元单位面积农业灌溉用水量，计算单位为亿m³/kha；为上级行政单元农业用水量，计算单位为亿m³；为上级行政单元灌溉面积，计算单位为kha。

从上面所述可以看出，本发明提供的基于BP网络和基尼系数定权重的用水数据离散化方法，通过精确划分基本计算单元并进行相应数据统计、然后进行数据预处理、进一步进行空间离散化、最后采用结果修正和数据汇总完成数据后处理的方法，获得了全国各级水资源分区经济社会及用水数据，有助于水资源综合管理；并且该方法适用于各级行政单元经济社会数据与用水数据空间离散化处理，其数据结果质量高，从而减小了水资源分区用水数据人力普查工作量和相关投入。

附图说明

图1为本发明提供的基于BP网络和基尼系数定权重的用水数据离散化方法的一个实施例的流程示意图；

图2为本发明提供的基于BP网络和基尼系数定权重的用水数据离散化方法的另一实施例的流程示意图；

图3为本发明提供的基于BP网络和基尼系数定权重的用水数据离散化方法实施例中基本计算单元划分的示意图；

图4为本发明提供的基于BP网络和基尼系数定权重的用水数据离散化方法实施例中数据空间离散化模型神经网络拓扑结构示意图；

图5为本发明提供的基于BP网络和基尼系数定权重的用水数据离散化方法实施例中基于BP神经网络的空间离散化模型构架示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本发明进一步详细说明。

需要说明的是，本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量，可见“第一”“第二”仅为了表述的方便，不应理解为对本发明实施例的限定，后续实施例对此不再一一说明。

参照附图1，为本发明提供的基于BP网络和基尼系数定权重的用水数据离散化方法的一个实施例的流程示意图。

所述基于BP网络和基尼系数定权重的用水数据离散化方法，包括：

步骤101：将县级行政区与水资源三级区矢量图进行叠加嵌套，获得每个县级行政单元所属不同水资源三级区部分的基本空间单元，作为基本计算单元；

步骤102：将各类土地利用数据和DEM数据统计到各基本计算单元和行政单元空间上，获得基本计算单元和行政单元空间要素数据集；

步骤103：根据各级行政单元经济社会用水数据，对县级行政单元生活用水、工业用水和农业用水采用定额法补充，对生态环境用水量采用相关因子分摊法进行补充；

步骤104：对生态环境用水量采用相关因子分摊法进行补充得到的计算公式中的权重系数采用基尼系数法确定；

步骤105：基于BP人工神经网络模型，利用数据指标间相关关系，经过模拟计算得到基本计算单元上离散预测值，从而将县级行政单元经济社会用水数据展布到基本计算单元上；

步骤106：以各基本计算单元预测值作为权重由所属县级行政单元总值向下分摊进行结果修正；

步骤107：将修正后的经济社会和用水数据值，按基本计算单元的水资源分区属性逐级汇总得到相应的用水数据。

参照附图2，为本发明提供的基于BP网络和基尼系数定权重的用水数据离散化方法的另一实施例的流程示意图。

所述基于BP网络和基尼系数定权重的用水数据离散化方法包括：

步骤100：基础数据收集；

步骤200：计算单元划分与数据统计；

步骤300：数据预处理；

步骤400：空间离散化；

步骤500：数据后处理。

进一步的，所述步骤200——计算单元划分与数据统计，主要是指按水资源区划的原则将行政分区单元分割成分辨率更高的具有水资源分区属性的空间单元，作为空间离散化的基本计算单元；然后对基本计算单元上空间要素进行统计分析。具体地，还可包括下述步骤：

步骤201：在地理信息系统软件Arc GIS中利用“intersect”命令对县级行政区与水资源三级区矢量图进行叠加嵌套（参照附图3）；

步骤202：获得每个县级行政单元所属不同水资源三级区部分的基本空间单元，即为基本计算单元；

同时，还可对小于所在县级行政区面积10%的基本计算单元进一步处理，将其向邻近面积最大的基本计算单元合并。

步骤203：利用获得基本计算单元矢量图和空间数据（DEM和MODIS 土地利用），基于Arc GIS区域统计（Zonal Statistics）模块，将各类土地利用数据和DEM数据统计到各基本计算单元上；

同时，利用行政区单元矢量图同样统计获得各级行政单元各类土地利用和DEM数据；

从而获得基本计算单元和行政单元空间要素数据集，用于空间离散化分析。

较佳的，所述步骤300——数据预处理：主要指在尽最大努力获取基础数据前提下，对可能存在的行政单元经济社会用水数据缺失问题，采用合理的分析算法进行补充；对统计数据多样问题，采用自上级向下级分摊方式进行修正。最终获得一套完整且配套的各级行政单元经济社会用水基础数据集。具体地，还可包括下述步骤：

步骤301：数据补充：根据各级行政单元经济社会用水数据，对县级行政单元生活用水、工业用水和农业用水采用定额法补充，对生态环境用水量采用相关因子分摊法进行补充。补充方法如下：

（1）生活用水量补充

生活用水量的重要影响因子是人口数。一个区域的生活用水量与其总人口数存正相关关系。而由于统计数据本身的缺失，对于本地区当年生活用水综合定额无法计算得到。因此，假设上一级行政区单元生活用水综合定额与其下一级行政单元生活用水综合定额相同，即满足下式：

式中：为行政单元i当年生活用水量，单位为亿m³；Nⁱ为行政单元i当年用水人口数，计算单位为万人；为行政单元i的上级行政单元当年人均生活用水综合定额，计算单位为L/人·d；为行政单元i的上级行政单元当年生活用水量，计算单位为亿m³；N^上为行政单元i的上级行政单元当年用水人口数，计算单位为万人。

（2）工业用水量补充

以工业增加值作为用水定额主要影响因素，假设上一级行政区单元工业用水定额与其下一级行政单元工业用水综合定额相等，即满足下式：

式中：为行政单元i当年工业用水量，计算单位为亿m³；为行政单元i当年工业增加值，计算单位为万元；为行政单元i的上级行政单元当年万元工业增加值用水量，计算单位为亿m³/万元；为行政单元i 的上级行政单元当年工业用水总量，计算单位为亿m³；为行政单元i的上级行政单元当年工业增加值，计算单位为万元。

（3）农业用水量补充

在上级行政单元降水、蒸发及其他灌溉技术水平一定的条件下，假设下级行政单元作物灌溉强度与相应上级行政单元相同，可由灌溉面积计算下级行政单元农业用水量：

式中：为行政单元i农业用水量，计算单位为亿m³；为行政单元i农业灌溉面积，kha；为上一级行政单元单位面积农业灌溉用水量，亿m³/kha；为上级行政单元农业用水量，计算单位为亿m³；为上级行政单元灌溉面积，kha。

（4）生态环境用水量补充

生态环境用水量，与经济发展状况密切相关。随着经济社会的发展，生态环境用水需求增加，其主要影响因素包括林地、草地、水域、城镇用地、 GDP和非农业人口。各级行政单元生态环境用水量计算如下：

式中：k_i(i=1,2,3,4,5,6)为权重系数；为行政单元i生态环境用水量，计算单位为亿m³；为上一级行政单元生态环境用水量，计算单位为亿m³；为行政单元i林地面积，计算单位为kha；为上一级行政单元林地面积，计算单位为kha；为行政单元i草地面积，计算单位为kha；为上一级行政单元草地面积，计算单位为 kha；为行政单元i水域面积，计算单位为kha；为上一级行政单元水域面积，计算单位为kha；为行政单元i城镇用地面积，计算单位为kha；为上一级行政单元城镇用地面积，计算单位为kha； GDPⁱ为行政单元i国民生产总值，计算单位为万元；GDP^上为上一级行政单元国民生产总值，计算单位为万元；为行政单元i非农业人口数，计算单位为万人；为上一级行政单元非农业人口数，计算单位为万人。

进一步的，对于公式（4）中的权重系数，采用基尼系数法来确定，具体确定方法如下：

基尼系数（Gini Coefficient）是一个定量测定收入分配差异程度的指标，是用来综合考察居民内部收入分配差异状况的一个重要分析指标。此处采用基尼系数赋权法，通过计算评价指标基尼系数值大小，以反映该指标不同评价对象之间的数据差异的大小。具体计算过程如下：

首先，对各指标样本数据进行归一化处理，计算公式如下：

$Y_{ki} = \frac{V_{ki}}{Σ_{i = 1}^{n} V_{ki}} - - - (5)$

式中：Y_ki为第k个指标的第i个样本数据归一化后的值；V_ki为第k个指标的第i个样本数据。

评价指标基尼系数值计算如下式所示：

$G_{k} = Σ_{i = 1}^{n} Σ_{j = 1}^{n} \frac{| Y_{ki} - Y_{kj} |}{{2 n}^{2} μ_{k}} - - - (6)$

$G_{k} = Σ_{i = 1}^{n} Σ_{j = 1}^{n} \frac{| Y_{ki} - Y_{kj} |}{n^{2} - n} - - - (7)$

式（6）和（7）中：G_k为第k个指标的基尼系数值；n为指标的数据总数；μ_k为第k个指标所有归一化样本的期望值。当指标归一化样本的均值不为0时，指标的基尼系数值采用公式（6）计算；而当其均值为0时，采用公式（7）计算。

基于计算获得的基尼系数值可计算获得基尼系数权重，公式如下：

$g_{k} = \frac{G_{k}}{Σ_{i = 1}^{m} G_{i}} - - - (8)$

其中：g_k为第k个指标的基尼系数权重；G_k为第k个指标的基尼系数值，m为指标个数。计算所得g_k即为生态环境用水量补充权重系数K_k（k=1,2,3,4,5,6）。

步骤302：数据修正：考虑各级行政单元可能存在统计口径不一的问题，在补充后数据的基础上，以下级行政单元值作为权重由上级行政单元总值逐级向下分摊，如下式所示：

式中：为上一级数据修正后的数据总值，全国总数不作修正；为修正后的行政单元i的数据值；为行政单元i的原始数据值。修正后的数据特征为：全国总值等于各省之和，各省总值等于其下各市之和，各市总值等于其下各区县之和。

进一步的，所述步骤400——空间离散化：主要是指在数据预处理所得相关基础数据的基础上，基于BP人工神经网络模型，利用数据指标间相关关系，进行模拟预测将县级行政单元经济社会用水数据展布到基本计算单元上的过程。具体地，基于BP人工神经网络模型的经济社会用水数据空间离散化方法，还可进一步包括下述步骤：

步骤401：根据人工神经网络理论，构建经济社会用水数据空间离散化 BP人工神经网络三层网络拓扑结构（参照附图4）。数据空间离散化神经网络包括输入层、隐含层和输出层三层。影响指标数据作为自变量进入输入层，同时影响指标向量维数决定了输入层节点的个数m，输出层节点数n，即模拟的因变量的结果。隐含层的输出函数为Sigmoid变换函数，输入和输出函数为线性函数。正向传播过程中，输入信息从输入层经隐含层逐层处理，每一层节点的状态只影响下一层节点的状态。如果在输出层不能得到期望的输出，则转入反向传播，将误差信号沿原来的连接通路返回，通过修改各层节点的权值，使误差最小。BP人工神经网络具有极强的模拟分析与预测能力，保证了空间离散化数据成果的质量。

步骤402：基于BP人工神经网络模型，经济社会用水数据模拟预测流程见图5所示。模拟过程中，将任意2/3的数据样本进行训练学习，模拟因变量与其相关的自变量间复杂的非线性关系；同时，将另外1/3的样本作为验证数据，以验证训练学习效果。分别计算训练学习阶段和验证阶段模拟结果与实测样本间的相关系数R1²和R2²，当两者均大于常数α（0<α<1）时认为训练效果合格，一般取α=0.7～0.8。最后，以验证合格的神经网络预测模型，输入基本计算单元上与因变量相关的自变量指标数据，经过模拟计算得到基本计算单元上离散预测结果。

因BP人工神经网络模型预测输出到基本计算单元的数值并非与行政单元数据相匹配，进一步的，所述步骤500——数据后处理，具体包括：进一步修正预测数据结果，并按基本计算单元的水资源分区属性进一步汇总统计，得到各水资源区分布情况。具体包括以下步骤：

步骤501：结果修正：以各基本计算单元预测值作为权重由所属县级行政单元总值向下分摊修正，如下式所示。

式中：为神经网络模型预测得到经济社会以及用水指标在基本计算单元i上的值；为基本计算单元i所属县级行政单元上经修正后的数据值；为修正后的基本计算单元i的数据值。

步骤502：各级水资源分区用水数据汇总：将修正后的经济社会和用水数据值，按基本计算单元的水资源分区属性逐级汇总，计算表达式如下：

式中：为修正后的基本计算单元i的数据值；为基本计算单元 i所属水资源三级区j对应指标数据值；为水资源三级区j所属水资源二级区k对应指标数据值；为水资源二级区k所属水资源一级区l对应指标数据值。

为了更清楚本发明提供的方法能够如何应用，下面结合方法应用实施例进行说明：

结合参照附图1和附图2，所述方法用于经济社会用水空间离散化的主要思想为：首先，利用空间数据和GIS技术进行空间计算单元的划分，确定数据离散化的基本计算单元，并统计获得基本计算单元和行政分区单元相关的空间要素数据。同时，利用各级行政单元的经济社会数据、空间要素数据和用水数据，进行经济社会用水数据补充和修正，形成一套完整的行政分区基础数据集。然后，基于县级行政区和基本计算单元的基础数据，并考虑数据指标间相关关系，利用BP人工神经网络模型先后将经济社会数据和用水数据向基本计算单元空间离散化。最后，参考各县级行政区数据，将离散得到预测值进一步修正处理，并按水资源分区汇总用水数据结果，得到水资源一级区、水资源二级区和水资源三级区经济社会用水数据离散结果。

该方法不仅能将用水数据空间离散到各级水资源区上，还可将相关经济社会数据离散展布到水资源区单元上。以下对各处理步骤进行详细描述：

基础数据收集。根据经济社会用水数据同化与空间离散化的要求，需首先收集基础分析数据，主要包括：空间数据和各级（省、市、县）行政单元经济社会数据与用水数据，如表1所示。其中，空间数据和各级行政单元经济社会数据应是完善的，而各级行政单元用水数据则可能存在数据缺失和统计数据多样的问题。

表1 基础数据体系

计算单元划分。根据图1或图2所示流程，利用收集得到的县级行政单元和水资源三级区矢量图，进行Arc GIS矢量图叠套，获得基本计算单元分布矢量图。

空间数据统计。利用所得基本计算单元矢量图以及DEM和MODIS土地利用，基于Arc GIS区域统计模块统计得到各县级行政单元和基本计算单元 DEM数据（包括海拔和坡度）与六种土地利用数据（见表1），为BP人工神经网络的模拟预测作数据准备。

用水数据补充。如在收集到的基础数据中，行政单元经济社会用水数据存在缺失的问题，那么根据公式（1）～（3）分别计算补充完善各级行政单元生活、工业和农业用水数据。根据公式（5）～（8），以各省级行政单元分组，先后对每个省份下所有县级行政单元的林地、草地、水域和城镇用地面积（由第三步获得）以及GDP和非农业人口数据进行归一化处理，并计算各省级行政单元内生态用水量补充需的基尼权重系数。最后根据公式（4），计算并补充完善各县级行政单元生态环境用水量。

数据修正。根据经济社会用水数据修正算法（见公式（9）），将补充完善后的各级行政单元基础数据进一步修正，获得上下级匹配的经济社会用水数据集。

BP人工神经网络模拟预测。在前述数据准备完成后，基于BP人工神经网络模型进行经济社会用水数据模拟预测，参照附图5。为尽量减小地区差异性对模拟训练和离散预测效果的影响，分别按水资源一级区分组进行训练模拟和离散预测分析——输入的训练样本主要来自单个水资源一级区所涉及县级行政单元的指标数据样本。考虑到地空间要素指标、经济社会指标与用水指标三者之间的相关关系，建立用水数据空间离散化神经网络模拟预测指标体系，自变量与因变量指标如表2所示。在此基础上构建经济社会用水数据空间离散化流程：首先将县级行政单元的空间要素指标（海拔、坡度、土地利用）作为自变量，经济社会指标（人口、经济、农业生产）为因变量，进行神经网络训练，验证合格后输入基本计算单元上海拔、坡度、土地利用数据将经济社会数据离散预测到基本计算单元上；再以同样的方式，将空间要素指标和经济社会指标作为自变量，经济社会用水指标为因变量，将用水数据离散到基本计算单元上。最终，离散获得基本计算单元经济社会数据和经济社会用水数据的模拟预测值。

表2 用水数据空间离散化神经网络模拟指标体系

自变量指标因变量指标海拔、坡度、土地利用类人口类、经济类、农业生产类海拔、坡度、土地利用类、人口类、经济类、农业生产类生活用水量、工业用水量、农业用水量、生态环境用水量

结果修正。根据公式（10），将第六步离散预测得到的基本计算单元经济社会数据和经济社会用水数据进一步修正处理，获得与县级行政单元相匹配的数据集。

各级水资源分区用水数据汇总。根据公式（11），对第七步得到的基本计算单元数据结果分逐级汇总，获得各水资源分区上经济社会与经济社会用水数据。

所属领域的普通技术人员应当理解：以上所述仅为本发明的具体实施例而已，并不用于限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 基于BP网络和基尼系数定权重的用水数据离散化方法 [P] . 中国专利： CN103886220B . 2017.02.01
2. 基于BP网络和基尼系数定权重的用水数据离散化方法 [P] . 中国专利： CN103886220A . 2014-06-25
3. Weight data storage method, and neural network processor based on method [P] . IL274535D0 . 2020-06-30

机译：权重数据存储方法及基于该方法的神经网络处理器
4. Method and system for scheduling data transmissions based on priority value and radio access network slice weight [P] . US11147089B2 . 2021-10-12

机译：基于优先级值和无线电接入网络切片权重调度数据传输的方法和系统
5. METHOD AND SYSTEM FOR SCHEDULING DATA TRANSMISSIONS BASED ON PRIORITY VALUE AND RADIO ACCESS NETWORK SLICE WEIGHT [P] . US2021400686A1 . 2021-12-23

机译：基于优先级值和无线电接入网络切片权重调度数据传输的方法和系统