首页> 中国专利> 一种基于地理网格的政务信息资源整合方法

一种基于地理网格的政务信息资源整合方法

摘要

一种基于地理网格的政务信息资源整合方法,包括多层级地理网格划分步骤,政务信息资源的空间化处理步骤,政务信息资源的时空一致性处理步骤和多尺度地理网格的信息整合步骤,充分利用地理网格划分技术、网格编码方法、文本分词提取方法和空间统计分析技术,实现政务信息与空间信息的融合,并进行政务信息资源深度的整合应用,将单一类型数据的网格化分析上升到多类型、多尺度的政务信息资源在网格内整合分析,有利于在指定区域内开展综合性政务数据空间分布、对比和关联分析。在政府区域规划、突发事件应急中可快速实现信息提取和资源整合。

著录项

  • 公开/公告号CN107092680A

    专利类型发明专利

  • 公开/公告日2017-08-25

    原文格式PDF

  • 申请/专利权人 中国测绘科学研究院;

    申请/专利号CN201710264026.0

  • 申请日2017-04-21

  • 分类号G06F17/30(20060101);G06Q50/26(20120101);

  • 代理机构11532 北京市天玺沐泽专利代理事务所(普通合伙);

  • 代理人鲍晓

  • 地址 100036 北京市海淀区莲花池西路28号

  • 入库时间 2023-06-19 03:09:15

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-12-10

    授权

    授权

  • 2017-09-19

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20170421

    实质审查的生效

  • 2017-08-25

    公开

    公开

说明书

技术领域

本申请涉及一种信息处理方法,具体的,涉及一种基于地理网格的政务信息资源整合方法。

背景技术

政府信息资源在全社会资源中占有及其重要的位置,是一种具有重要价值的国家资源。目前,我国政务信息资源的整合与共享建设中存在较大问题。信息孤岛现象大量存在,使得现有的整合与共享规划难以继续发挥效果,也制约了我国电子政务的进一步发展。信息资源整合是一项复杂的系统工程,它涉及技术、经济、人文等多方面的因素。同时,政务信息资源在尺度、时态、语义上的多样化和复杂化对数据的整合、共享、分析、理解和呈现带来了巨大挑战。研究人员对信息资源整合的方法进行了总结概括,包括主题法、元数据法、政务信息资源本体构建、主题图应用等方法,信息资源的整合模式包括纵向整合、横向整合和交叉整合。整合模式和方法从信息资源本身出发,主要集中于手工层面,对于从地理信息维度开展政务信息资源的深层次的整合分析还非常少。

在地理学中,网格是将连续工作区域的平面空间离散化,按一定的规则进行分割,形成若干多边形,每个多边形称为网格单元,并赋予标识符(例如,地理编码)。早期,众多学者利用地理网格开展人口、资源、环境方面空间化研究,聚焦于单项指标空间分布及格局分析,缺少对多指标数据网格化整合及空间关联分析。随后,有学者将地理网格理念引入到城市管理领域,许多城市己经建成城市网格化管理信息平台,例如北京市东城区、武汉市江汉区等网格化管理系统,并成功应用于公共设施、环境治安等城市治理工作。城市网格管理实现了特定区域内多源数据呈现,但缺少地理网格下多尺度政务信息资源综合治理及深度分析方面研究。

信息资源整合并非将所有数据物理集中,更多是物理分散、逻辑聚合的方式进行整合,地理网格具备统一管控、分而治之的特点,为各地区、各部门信息资源整合提供一体化空间索引。所以,利用地理网格分别对不同行政级别人口、法人、经济、教育、卫生等政务信息资源进行定位和分配,按照多尺度网格进行数据统计和整合,有利于地理信息支撑下的政务信息资源快速定位、整合分析及综合呈现。

总的来说,政务信息资源整合领域,主要侧重于面向政府的层次分析、知识管理、集成管理和主题图等整合技术的研究。面向政务信息交流和面向政务信息用户,缺乏涉及空间上的数据整合方法研究和更深层析的整合分析。如何克服上述的缺陷,将空间的数据与政务信息进行更好的整合,以便于用户更好的获取信息成为现有技术亟需解决的技术问题。

发明内容

本发明的目的在于提出一种基于地理网格的政务信息资源整合方法,利用地理网格划分技术、网格编码、文本分词和空间关联分析等技术,实现政务信息与空间信息的融合。

为达此目的,本发明采用以下技术方案:

一种基于地理网格的政务信息资源整合方法,其特征在于,包括如下步骤:

S110.多层级地理网格划分步骤:

基于国家行政区划数据,构建多层级的地理格网,并将所述地理网格与行政区进行叠加,在每个地理网格内标注相应的属性信息;

S120.政务信息资源的空间化处理步骤:

将政务信息基于地名实体库、语义计算或中文分词,将结构化与非结构化的各种信息与空间数据进行关联整合,所述政务信息包括但不限于人口、经济、法人、教育、医疗、环境监测和资源分布,所述政务信息的数据类型包括文本、表格和多媒体;

S140.多尺度地理网格的信息整合步骤

将地理网格,以及空间化后的政务信息进行信息资源整合,以实现在多分辨率、多尺度下的地理网格政务信息资源整合。

优选的,在政务信息资源的空间化处理步骤和多尺度地理网格的信息整合之间,还包括:

S130.政务信息资源的时空一致性处理步骤

对于由于各种原因,而导致在时间或者空间上存在不一致而无法整合的政务信息,进行时间和空间的一致性处理。

优选的,所述多层级地理网格划分步骤具体包括:

1)按照国家行政区划,构建国家、省、地级市、县、乡镇五级行政区划格网,

2)对每一级行政区划,构建不同尺度的地理方格,

3)将地理方格与行政区划多边形进行叠加分析,标定每个地理方格属性信息,所述属性信息包括:格网大小、格网左上角起点、中心点、格网等级、网格编码、网格所属行政区划。

优选的,在所述多层级地理网格划分步骤中,对于跨行政区划的地理网格,增加属性进行特殊标记,所属行政区划设置为空。

优选的,在所述多层级地理网格划分步骤中,每个地理网格以其中心点的坐标来确定其地理位置,并能够根据数据分布的密集程度对划分后的网格进一步划分,将数据分布密集的网格则可以根据需要细分成从高层次到低层次的不同粒度的地理网格。

优选的,所述政务信息资源的空间化处理步骤具体包括如下方式:

1)地名地址实体数据空间化

①单点地名匹配:根据后台全量地名地址数据库,匹配出相同行政区划下单的地名坐标值,②街道门牌号匹配:对提取出的街道类地址,匹配出坐标串,③区域或归属地行政区划匹配,实现对地名、身份证号码所在地区、邮政编码所在地区、手机号码归属地,匹配出空间坐标范围,④非标准地址匹配功能,将非标准地名地址、重名地名地址等无法匹配的内容,利用上下文可定位信息辅助决策的方法判定最佳位置;

2)政区统计数据空间化

①建立地理因子库.通过建立包括地形要素、海拔高程带、坡度带、坡向带和/或土地利用数据的地理因子库,②构建多因子加权融合建模,以单因子归一化权重系数和/或类因子归一化权重系数的乘积作为综合权重系数来计算各单元信息资源数据分配的权重系数,从而通过统计各标准单元内各相关因子数值,③建立区域统计指标密度模型,结合统计指标空间分布的限制条件,对相关分析中奇异点的处理实现统计数据在空间单元内的定量分布,解决统计指标在规则格网空间化;

3)地名标签文本数据空间化

①文本分词.实现对包含地址的文本进行切分,使文本成一个个单词形态,从自然语言描述的文本中提取出地名、地址,身份证号码,邮政编码、手机号码或重点POI,②地名提取,利用行政区划、地名数据库提取与地理空间相关分词,③地名匹配,对提取结果进行统计,计算该文本与行政区划、地名的相关度,将最相关的行政区划、地名作为该文本信息资源的地理元数据。

优选的,所述政务信息资源的时空一致性处理步骤具体包括:

同一政区,不同时间节点数据的一致性处理:

1)对时间属性存在差异的空间数据进行整理,按照时间轴进行组织,利用度量方法对于采集时间不明的空间数据的时间信息进行补齐,

2)矢量数据中由于不同时间采集而导致冲突的几何对象的一致化处理算法,通过几何、拓扑或语义的分析决定存在冲突的空间对象的选择,

3)属性数据在时轴上的内插与外推算法,通过内插与外推,将属性数据进行时轴上的对齐,便于进行空间统计与分析;

行政区划发生变更的数据一致性处理:

1)根据行政区划等级,提取发生变更的区域范围,并按照同原始地理网格相同的划分方式重新进行网格划分,

2)根据变更的行政区划范围,提取相关政务信息数据,根据政务信息资源的空间化处理步骤重新进行数据的空间化处理,

3)将空间化处理后的数据与原始数据进行空间融合,替换发生变更的空间网格。

优选的,所述多尺度地理网格的信息整合步骤具体包括:

1)在信息资源空间化基础上,逐条进行标引,为空间相关信息资源增加行政区划编码、规则地理网格编码属性;

2)对于任意目标区域,快速获取区域内多尺度网格列表;

3)根据地理网格列表,通过地理网格索引提取并合并地理区域内的网格信息资源;

4)通过超文本与地理信息编辑和图文混合排版,实现多来源、多尺度业务文本、表格信息与地理信息,在网格对象级的整合与一体化展示。

本发明将传统地理网格管理技术引入到政务信息资源整合中,融合行政区划不规则地理网格和多层次规则地理网格统计丰富,充分利用地理网格划分技术、网格编码方法、文本分词提取方法和空间统计分析技术,实现政务信息与空间信息的融合,并进行政务信息资源深度的整合应用,将单一类型数据的网格化分析上升到多类型、多尺度的政务信息资源在网格内整合分析,有利于在指定区域内开展综合性政务数据空间分布、对比和关联分析。在政府区域规划、突发事件应急中可快速实现信息提取和资源整合。

附图说明

图1是根据本发明的基于地理网格的政务信息资源整合方法的流程图;

图2是根据本发明的具体实施例对政务信息与空间信息的融合,并进行政务信息资源深度整合应用的示例;

图3是根据本发明的具体实施例对区县范围内经济情况进行关联显示的示例图;

图4是根据本发明的具体实施例对乡镇范围内经济情况进行关联显示的示例图;

图5是根据本发明的具体实施例对网格内的企业法人、经济、环境、人口等要素数据进行关联显示的示例图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。

本发明充分利用地理网格划分技术、网格编码方法、文本分词提取方法和空间统计分析技术,实现政务信息与空间信息的融合,并进行政务信息资源深度的整合应用。

具体而言,本发明包括如下步骤:

S110.多层级地理网格划分步骤:

基于国家行政区划数据,构建多层级的地理格网,并将所述地理网格与行政区进行叠加,在每个地理网格内标注相应的属性信息。

具体而言,可以包括:

1)按照国家行政区划,构建国家、省(自治区、直辖市、特别行政区)、地级市、县(县级市)、乡镇(街道)五级行政区划格网;

2)对每一级行政区划,构建不同尺度的地理方格。

例如,省级设为100KM×100KM,市级设为20KM×20KM,县级设为5KM×5KM等。网格划分可以根据实际需求动态调整。动态调整后,根据后续技术流程自动更新编码和相关属性。即,当用户用鼠标放大,或者缩小的时候,能够根据用户的指令对网格进行动态的划分,从而实现画面的放大或者缩小。

3)将地理方格与行政区划多边形进行叠加分析,标定每个地理方格属性信息,所述属性信息包括:格网大小(即边长)、格网左上角起点、中心点(经纬度)、格网等级(省、市、县、乡镇)、网格编码(层级+经度方向序号+纬度方向序号)、网格所属行政区划(例如街道级网格形式为:中国、北京、市辖区、海淀、永定街道,12位行政区划编码)。

特别的,对于跨行政区划的地理网格,增加属性进行特殊标记,所属行政区划设置为空。由于信息资源均标引地理网格编码、行政区划编码,在整合中可以根据信息资源两个属性解决跨行政区划的地理网格无行政编码问题。

本发明采用规则格网对不同等级的行政区划数据进行划分,划分地理网格时首先将地图按照一定的长宽值划分成规则的方格网,每个方格网的面积相同。这些方格网构成了规则的地理网格,每个地理网格以其中心点的坐标来确定其地理位置。同时,可以根据数据分布的密集程度对划分后的网格进一步划分,将数据分布密集的网格则可以根据需要细分成从高层次到低层次的不同粒度的地理网格。不同等级的行政区划数据,在比例尺和详细程度的上存在差异,划分后的地理网格在划分尺度上应满足数据整合与可视化的要求。划分粒度过小容易造成信息资源空间化上的冗余,增加资源空间化时间,同时降低信息资源的管理效率;划分粒度过大则不能较好的展示信息资源的空间化情况,失去信息资源整合的实际意义。

S120.政务信息资源的空间化处理步骤:

将政务信息基于地名实体库、语义计算或中文分词,将结构化与非结构化的各种信息与空间数据进行关联整合,所述政务信息包括但不限于人口、经济、法人、教育(学校)、医疗(医院、医疗机构)、环境监测和资源分布,所述政务信息的数据类型包括文本、表格和多媒体。

具体而言,可以包括如下方式:

1)地名地址实体数据空间化。对于例如企业、学校、医院等具备空间实体信息资源,可以通过地址数据库,或者街道门牌号,邮政编码、手机号等任何可能得到的与地址有关的信息,以作为其地理元数据,包括:

①单点地名匹配:根据后台全量地名地址数据库,匹配出相同行政区划下单的地名坐标值(例如点状类型);②街道门牌号匹配:对提取出的街道类地址,匹配出坐标串(例如,线状类型);③区域或归属地行政区划匹配,实现对地名、身份证号码所在地区、邮政编码所在地区、手机号码归属地,匹配出空间坐标范围;④非标准地址匹配功能,将非标准地名地址、重名地名地址等无法匹配的内容,利用上下文可定位信息辅助决策的方法判定最佳位置。

2)政区统计数据空间化。对于例如人口、经济等统计性信息,其信息中并不包含地理位置信息,只与行政区划有关系,且该信息并不是平均的分配在整个行政区划中。例如,同一个行政区中,人口主要集中在平原或者地势平缓地区,经济总量主要集中在人口相对密集的区域,而非高山、海洋中。此时,则需要综合考虑政务信息资源数据与地理位置、地形要素、地貌形态、土地覆盖现状等密切相关性建立政区统计数据空间化方法,包括:

①建立地理因子库。通过建立包括地形要素(居民地、水系、公路、铁路等)、海拔高程带、坡度带、坡向带和/或土地利用数据的地理因子库;②构建多因子加权融合建模,以单因子归一化权重系数和/或类因子归一化权重系数的乘积作为综合权重系数来计算各单元信息资源数据分配的权重系数,从而通过统计各标准单元内各相关因子数值;③建立区域统计指标密度模型,结合统计指标空间分布的限制条件(例如高程限制、坡度限制、水体限制等),对相关分析中奇异点的处理实现统计数据在空间单元内的定量分布,解决统计指标在规则格网空间化。所述奇异点即一些不可能存在相应统计性信息的地域,例如无人区、密林、山谷等地域。

3)地名标签文本数据空间化。对于一些文化类的信息,例如地方志、地方舆论事件、地方政策报道等信息资源,则通过提取报道中涉及地名的相关文本信息的方法,并进行匹配的方法进行数据的空间化。

①文本分词.实现对包含地址的文本进行切分,使文本成一个个单词形态,从自然语言描述的文本中提取出地名、地址,身份证号码,邮政编码、手机号码或重点POI;②地名提取,利用行政区划、地名数据库提取与地理空间相关分词;③地名匹配,对提取结果进行统计,计算该文本与行政区划、地名的相关度,将最相关的行政区划、地名作为该文本信息资源的地理元数据。

S130.政务信息资源的时空一致性处理步骤

对于政务信息,会由于各种原因,而导致在时间或者空间上存在不一致而无法整合。例如由于来源于不同出处的信息,而导致该信息存在这时间断档;或者某些地理区域由于行政区域的变更而导致信息前后不一致,例如城区合并,区域管理辖区发生变更等等,都需要对上述特殊的情况进行时间和空间的一致性处理。

具体的,包括:

同一政区,不同时间节点数据的一致性处理:

1)对时间属性存在差异的空间数据进行整理,按照时间轴进行组织,利用例如最短编辑距离等度量方法对于采集时间不明的空间数据的时间信息进行补齐。

该处理指的是,针对所采取的某些数据,由于种种原因而导致缺少其中一段时间的数据,则利用上述方法进行缺失的历史数据的补齐,例如根据该数据发展的趋势进行历史数据的补齐。

2)矢量数据中由于不同时间采集而导致冲突的几何对象的一致化处理算法,通过几何、拓扑、语义等分析决定存在冲突的空间对象的选择。

该步骤指的是,某些数据由于建制发生变化而导致在时间上数据不一致,则利用上述方法进行缺失的数据的补齐。例如某些区县、乡镇合并或撤并,导致合并后的区划信息在某些时间节点上存在缺失,需要在将合并前的区县、乡镇信息关联到合并后的区划上,确保不同时间节点上数据一致性。

3)属性数据在时轴上的内插与外推算法,通过内插与外推,将属性数据进行时轴上的对齐,便于进行空间统计与分析。该步骤指的是,对于缺失的属性数据,由于各种原因没有采集,而利用前后的历史数据进行补齐。

例如在开展信息资源整合中,需要某地区、某时间点上人口、经济等统计信息,由于国家人口、经济等数据普查频率不高,往往多年一次,导致数据在某时间点上的缺失,此时将通过前后时间节点普查、调查数据进行内插处理,实现缺失数据资源的估算和补齐。

上述三种情况,即针对不同属性或者类别的数据,对于由于各种原因而导致确实历史数据,利用相应的方法通过计算补齐历史数据。

行政区划发生变更的数据一致性处理:

1)根据行政区划等级,提取发生变更的区域范围,并按照同原始地理网格相同的划分方式重新进行网格划分;

2)根据变更的行政区划范围,提取相关政务信息数据,根据政务信息资源的空间化处理步骤重新进行数据的空间化处理;

3)将空间化处理后的数据与原始数据进行空间融合,替换发生变更的空间网格。

该步骤,即将属于所要变更区域的数据重新进行网格划分以及数据处理,从而能够应对各种行政区划发生变化的情况。

在本发明中,政务信息资源的时空一致性处理步骤是针对政务信息资源的空间化处理步骤的纠正步骤,是为了处理S120步骤中所出现的特殊情况,是进一步优化步骤,而非必须步骤。

S140.多尺度地理网格的信息整合步骤

将地理网格,以及空间化后的政务信息进行信息资源整合,以实现在多分辨率、多尺度下的地理网格政务信息资源整合,即不同层级的政务信息,与不同级别的行政区划相整合,当用户使用不同的分辨率,即显示不同级别的行政区划时,显示相应的政务信息。

具体为:

1)在信息资源空间化基础上,逐条进行标引,为空间相关信息资源增加行政区划编码、规则地理网格编码属性;

2)对于任意目标区域,快速获取区域内多尺度网格列表;

3)根据地理网格列表,通过地理网格索引提取并合并地理区域内的网格信息资源;

4)通过超文本与地理信息编辑和图文混合排版,实现多来源、多尺度业务文本、表格信息与地理信息,在网格对象级的整合与一体化展示。

实施例1:

参见图2,示出了根据本发明的具体实施例对政务信息与空间信息的融合,并进行政务信息资源深度整合应用的示例。

将不同来源的政务信息资源,按照结构化数据和非结构化数据分别进行政务信息资源的空间化处理,匹配坐标,并且增加行政区划编码属性和地理网格索引属性,然后进行时空一致性处理和多尺度网格信息整合。

随后,参见图3、图4,多层次嵌套网格下述企业数量、区域经济等网格关联信息整合分析,数字为企业数量,灰度(或者颜色)表示GDP数值。其中网格标注数字为企业数量,灰度的深度表示经济热度。图3和图4分别表示在区县范围内,或者乡镇范围内企业数量或者区域经济的分布情况。

图5,是另一种示例的形式,利用网格和图标,综合表示网格内企业法人、经济、环境、人口等要素数据。

因此,本发明将传统地理网格管理技术引入到政务信息资源整合中,融合行政区划不规则地理网格和多层次规则地理网格统计丰富,充分利用地理网格划分技术、网格编码方法、文本分词提取方法和空间统计分析技术,实现政务信息与空间信息的融合,并进行政务信息资源深度的整合应用,将单一类型数据的网格化分析上升到多类型、多尺度的政务信息资源在网格内整合分析,有利于在指定区域内开展综合性政务数据空间分布、对比和关联分析。在政府区域规划、突发事件应急中可快速实现信息提取和资源整合。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施方式仅限于此,对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单的推演或替换,都应当视为属于本发明由所提交的权利要求书确定保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号