首页> 中国专利> 基于一张图的林业大数据建设方法

基于一张图的林业大数据建设方法

摘要

本发明公开了一种基于一张图的林业大数据建设方法,包括如下步骤:S1:数据整合;S2:数据融合;S3:按照预定策略对融合后的数据进行审核和质量检查;以及S4:按照预定的关系数据库的关系将林业数据拷贝入数据库。该方法实现了林业数据的结构化处理,提高林业数据的存储和读取效率,有利于数据挖掘和分析,消除了林业数据的信息孤岛。

著录项

  • 公开/公告号CN106547853A

    专利类型发明专利

  • 公开/公告日2017-03-29

    原文格式PDF

  • 申请/专利权人 北京航天泰坦科技股份有限公司;

    申请/专利号CN201610911852.5

  • 发明设计人 谭靖;李莹;彭松;张富华;

    申请日2016-10-19

  • 分类号G06F17/30(20060101);G06K9/62(20060101);

  • 代理机构北京同辉知识产权代理事务所(普通合伙);

  • 代理人刘洪勋

  • 地址 100083 北京市海淀区北四环中路229号海泰大厦1107室

  • 入库时间 2023-06-19 01:51:07

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-09-12

    专利权人的姓名或者名称、地址的变更 IPC(主分类):G06F16/25 专利号:ZL2016109118525 变更事项:专利权人 变更前:北京航天泰坦科技股份有限公司 变更后:航天科工(北京)空间信息应用股份有限公司 变更事项:地址 变更前:100083 北京市海淀区北四环中路229号海泰大厦1107室 变更后:100083 北京市海淀区北四环中路229号海泰大厦1107室

    专利权人的姓名或者名称、地址的变更

  • 2020-04-28

    授权

    授权

  • 2017-04-26

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20161019

    实质审查的生效

  • 2017-03-29

    公开

    公开

说明书

技术领域

本发明涉及大数据计算机技术领域,特别是一种基于一张图的林业大数据建设方法。

背景技术

目前,信息技术的快速普及和不断升级,使数据已经渗透到了社会生活的各个领域,逐渐成为一种日益重要的生产要素,人们对于海量数据的有效运用,将预示着新一轮生产率的增长和生产方式的改变。大数据时代的主要特点是数据量大,而是有效地挖掘和利用,这是各部门、各行业的普遍需求。

林业大数据除了容量大、类型多、存取速度快、应用价值高的特征外,林业数据的空间特征也尤为明显,建设难度较大。目前只有针对某项具体林业业务的林业数据整合方法,尚无林业大数据的建设方法。这导致的林业大数据不能够实现结构化存储,影响数据挖掘和分析时计算机对林业数据的处理效率,也增加了人工成本。如图1所示的县级林地一张图的建设方法,根据最新的高分辨率遥感影像,借助各种林业工程项目、征收占用林地、公益林区划、行政界线等资料,充分利用一类、二类调查成果数据,结合现地补充调查,进行林地区划,落实林地边界,构建县级林地落界数据库。在构建数据库时应确定该县3度带的中央经线、县级行政界线,将全县国土总面积、国家公益林面积作为控制指标。县、乡、村、林班、小班矢量数据分层管理,按命名规则进行命名。直属林业局及自然保护区按行政界线所在的县合并,以行政县为单位提交林地区划数据,县级行政界是确保全省林地“一张图”无缝拼接的基础,由国土部门统一提供。林地小班区划完成后,提取森林类别、质量等级、保护等级等专题信息,县、乡、村、林班、小班矢量数据及专题信息构成了县级林地“一张图”,即县级林地落界数据库。县级“一张图”最终形成要通过县级自查、省级抽查、国家验收三级检查。该方法只针对县级林地的具体业务进行一张图构建,利用率不高,存在信息孤岛的问题。

发明内容

本发明的目的是提供一种基于一张图的林业大数据建设方法,实现林业数据的结构化处理,提高林业数据的存储和读取效率,有利于数据挖掘和分析,消除了林业数据的信息孤岛。

为了实现上述目的,本发明提供的一种基于一张图的林业大数据建设方法,其特征在于,包括如下步骤:

S1:数据整合:

所述数据整合包括基础数据整合处理和林业数据整合处理;

所述基础数据整合处理包括基础地理数据整合和遥感影像数据整合;

所述基础地理数据整合包括:对不符合入库标准的数据进行数据格式转换,进行符合入库标准的编辑,然后拷贝至数据库;

所述遥感影像数据整合包括:对遥感图像的格式按照预定的规则进行转换,并对遥感图像进行校正;

所述林业数据整合处理包括:对提取的信息进行格式转换,统一为一致的数据格式,按照预定的关系数据库的关系将数据进行结构化处理,并对分类数据进行编码,然后进行图形处理,拷贝至数据库。

S2:数据融合:

确定空间数据的基准图层,在基准图层中融入与其空间位置相应的林业数据;

S3:按照预定策略对融合后的数据进行审核和质量检查;以及

S4:按照预定的关系数据库的关系将林业数据拷贝入数据库。

可选地或优选地,步骤S1中,基础地理数据整合处理的格式转换具体包括:将选取的基础地理数据统一转换为GIS数据。

3、根据权利要求1所述的基于一张图的林业大数据建设方法,其特征在于,步骤S1中,遥感影像数据整合的数据格式转换具体包括:将GEOTIFF的遥感影像数据转换为xml格式保存;

可选地或优选地,所述对遥感图像进行校正包括辐射校正、几何校正、数字高程模型校正中的至少一种或几种的组合。

可选地或优选地,所述图形处理包括对图形错误的处理、图面信息的补充、拓扑关系重构以及依照行业标准进行图幅的拼接或分割处理。

可选地或优选地,在步骤S2的数据融合过程中,还包括对融合的地图数据的精度控制,所述精度控制包括以下方式的至少一种或几种:

(1)对地图轮廓线的清晰化处理;

(2)控制扫描精度为0.05%,失真率小于0.1%,扫描分辨率为300-500dpi,保存为tiff格式;

(3)对扫描图进行图廓点采集,采集图廓点完毕后,各控制点图上误差<0.5mm,即实地均方差X方向<5m,Y方向<5m;标准网格线与地图公里网格完全套合;最后进行整体纠正,并将纠正好的单图幅地图数据保存。

可选地或优选地,所述图廓点包括4个内图廓点、4个外图廓点。

可选地或优选地,步骤S5中,所述数据库的逻辑设计包括矢量数据逻辑设计和格栅数据逻辑设计;

所述矢量数据逻辑设计包括根据不同的分区和不同的专题特征进行分类组织,在空间数据库中矢量数据以一分区和分层的组织形式进行存储,空间数据根据其特征码与其它林业业务属性信息或者关系型数据库中的数据进行关联;

所述格栅数据逻辑设计包括:对原始单幅或者单景卫星影像采用编目的方式存储;对经过几何纠正或正射校正处理的卫星影像,采用无缝镶嵌的方式存储。

本发明提供的基于一张图的林业大数据建设方法,对不同来源的异构的林业数据进行统一的格式转换,并按照预定规则转换为易于存储和读取的结构化数据,统一到数据库当中,完成了大数据的集成,方便图像处理过程中在一张图上反映全面的林业数据信息。解决了林业数据信息孤岛的问题,提高了数据挖掘过程中计算机对林业数据读取速度和处理效率。

附图说明

图1为本发明所提供的县级林地一张图的建设方法的流程图;

图2为基于一张图的林业大数据建设方法的流程图;

图3为基础地理数据整合技术流程图;

图4为遥感影像数据整合技术流程图;

图5为林业空间数据整合改造流程图;

图6为资料文本加工整理流程图;

图7为森林资源图像数据库整合技术流程图;

图8为连续清查基础成果数据库整合技术流程图;

图9为湿地分布数据库整合技术流程图;

图10为森林分布专题图像数据库整合技术流程图;

图11为野生动物信息库数据库整合技术流程图;

图12为野生植物信息库数据库整合技术流程图;

图13为自然保护区分布数据库整合技术流程图;

图14为天然林保护工程建设数据库整合技术流程图;

图15为退耕还林工程建设数据库整合技术流程图;

图16为林业有害生物发生、防治及灾害信息库数据库整合技术流程图;

图17为森林植物及其产品检疫数据库整合技术流程图;

图18为有害生物防治管理数据库整合技术流程图;

图19为数据库逻辑设计结构图;

图20为栅格数据库逻辑结构示意图;

图21为林业资源数据整合入库流程图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。

本发明实施例提供的林业大数据建设方法,基于一张图,开展公共基础数据、林业基础数据、林业综合数据、林业专题数据、林业信息产品数据的整合处理,采用统一时空框架、数据同化、非空间数据空间化等,将林业大数据以地图的方式进行整合、管理和分析,实现“一图胜千言”式数据管理与分析,为分析、决策提供了直观、时空定量的信息支撑,提高决策的科学性。

总体技术路线如图2所示,包括:

数据资源梳理:

数据资源梳理是林业大数据建设的核心资源。森林资源数据按照一定标准规范建库,形成森林资源数据库,用于描述和管理林地、林木的数量、质量、结构、布局及其相关关系。

森林资源数据分类如下表所示:

表1数据资源分类表

1、公共基础数据

包括基础地理、遥感影像、社会经济、气象等各种公共基础数据。

2、林业基础数据

由森林资源数据、生态环境及生物多样性、荒漠化治理土地数据、湿地资源数据以及城市园林绿化数据等构成。

森林资源数据:包括历次一类清查、二类调查成果数据,落实到山头地块的森林资源数据。

生态环境及生物多样性数据:包括典型性生态环境资源调查成果数据及生物多样性调查成果数据包括自然保护区、物种资源、典型生态环境等相关数据及分布情况数据。

荒漠化数据:包括历次荒漠化调查成果数据,落实到图班的荒漠化数据。

湿地资源数据:包含湿地类型、面积、分布,水资源状况,生物多样性及濒危野生动植物资源、湿地周围地区社会经济发展对湿地资源的影响等数据。

城市园林绿化数据:包含绿地占地、绿地覆盖、行道树、古树名木、公园绿地、生产绿地、防护绿地、附属绿地其他绿地等数据。

3、林业专题数据

林业专题数据由林业资源监管数据、林地数据、生态公益林数据、林权数据、苗圃地数据、营造林管理数据、林业灾害监控和应急措施管理数据等构成。

林业资源监管数据:包括各种资源利用和林地林权数据等,数据来源于征占用林地管理、采伐管理、运输和加工管理、林权管理、年度核查等实际业务工作,逐步形成资源监管数据库。资源监管数据以最近期资源消长变化数据为主,落实到山头地块。

林地数据:包含历次林地保护利用规划数据、林地变更数据以及林地征占用数据等;

生态公益林数据:包含历次国家公益林和地方公益林等数据;

林权数据:包含历次林权宗地数据;

苗圃地数据:包含苗圃地数据;

营造林管理数据:数据主要来源于林业重点工程营造林检查验收成果,落实到山头地块;一般造林数据来源于统计数据。

林业灾害监控和应急措施管理数据:数据主要来源于森林防火监测、有害生物日常调查和普查等成果,以及灾害防治、应急管理产生的业务数据。

4、林业综合数据

林业综合数据包含林业政策法规数据、林业标准数据、林业实用技术数据、林业产业综合数据、林业发展报告、林业综合决策支撑数据、林业项目管理数据、林业规划数据以及权利清单数据等构成。

林业政策法规数据:以国家林业局网站公布的林业法律为主,结合地方政策,建设包含了林业方面所有的法律、法规的数据。

林业标准数据:包含林业国标、行标数据等数据;

林业实用技术数据:包含林业工作手册、林业基础知识、办事流程信息等数据;

林业产业综合数据:包含木材经营加工信息,重点企业运营信息,林产品市场信息,林产品国际贸易信息,安全生产管理信息等数据;

林业发展报告数据:包含林业发展、重大问题调研、生态、信息化等方面报告等数据;

林业综合决策支撑数据:包含林业资源监管、监控、林业行政审批管理等辅助决策信息等数据;

林业项目管理数据:包含林业项目管理信息数据;

规划数据:规划数据包含林业规划数据以及其他单位规划数据;林业规划包含开山采石使用林地控制规划、荒漠化治理规划、林地保护利用规划、湿地规划、城市绿地系统规划、林业生态红线规划、大的生态红线规划以及各项公园专题规划等数据;其他单位规划数据包含土地利用规划、城市总规、国民经济总体规划、主体功能区区划等数据;

权利清单数据:包含行政审批等数据。

5、林业信息产品数据

为各类应用服务生成的信息产品。

进一步,还包括如下步骤:

S1:数据整合处理

S11:基础数据整合改造

基础数据整合改造工作主要承担基础地理数据和遥感影像数据两种数据类型的整合改造,主要任务是按照统一标准要求,对现有数据库进行数据抽取、标准化处理转换等综合整合改造,通过整合改造形成标准化、规范化、统一化的基础数据库。提高林业大数据的共享、交换能力。

S110:基础地理数据整合改造方案

针对基础地理信息资源标准与规范不统一、共享程度低、重复建设等问题,对基础地理数据进行整合改造。主要任务是综合利用各种来源的现势资料,如最新的行政勘界资料、地面实测数据等,确定基础地理要素,如道路、水系、居民地、地形、地名、行政界线等的位置变化及属性变化,对原有基础地理数据库要素进行增删、替换、关系协调以及质量检查、格式转换、编码转化等处理,生成新版基础地理数据库,其技术流程如图3所示。

1、数据内容

基础地理数据包括各种比例尺数字化地形图、DEM数据;省、市、县多级比例尺的行政区划图、交通道路、水系、城镇居民点、独立建筑物等数据;多级比例尺的土壤数据等。

2、数据质量检查

数据质量是指数据的可靠性和精度,在测量学中通常用误差来度量,在基础地理数据库建库过程中,有许多生产环节,每个环节均产生一定的误差,按误差传播理论,每项误差的传播直接影响到最终数的质量。因此,在数据入库之前需要进行详细的质量检查,以便数据质量符合入库质量要求。对于质量满足要求的数据直接入库,不满足要求的数据再进行数据转换与编辑等操作。

3、数据转换

将目前以其它格式存在的基础地理数据转换成GIS数据。例如把DWG的层转换成按照地形要素标准分层的shp格式文件。

4、数据编辑入库

把需要编辑的对象提取出来进行编辑如:道路构面,编辑道路中心线,房屋构面,被实体化的对象用线型或点来表示等。在编辑完成后对GIS数据进行质量检查,最后通过ArcSDE入库到Oracle数据库里。

S111:遥感影像数据整合改造方案

遥感图像的加工整理内容是将遥感图像数据加工处理成指定格式、规范命名的标准图像产品(其中也包括图像元数据的提取整合),具有多分辨率、产品多级多类、时效性强等特点。加工整理的工作量同改造产品级别、数据本身的质量以及遥感影像数据库的要求有关。图1为遥感影像数据整合技术流程图。

1、数据内容

遥感影像数据主要为多源、多时相、多分辨率海量遥感数据。

2、数据准备

首先把遥感影像数据从软件不能直接访问的介质上导入到硬盘等图像处理软件可以方便的直接访问的介质上,这样便于后期的图像处理工作。其次,按照林业局的文件命名规范对遥感数据文件重新命名,方便以后文件组织管理、建立数据字典等操作。

3、格式转换

对于数据可能存在多样格式,在改造过程化中首先需要统一格式。遥感数据采用图像文件GEOTIFF格式,然而由于GEOTIFF文件格式不能保存所有改造过程中需要的遥感信息,所以我们需要把其它必须的遥感图像信息使用xml格式的辅助文件保存起来,用于后期数据字典的建立。

4、图像预处理

遥感影像图像数据在进行其它改造之前,根据业务需要可能进行一些前期的预处理过程。比如进行去云处理、去噪处理等。

5、辐射校正

根据数据本身情况以及专题产品库的要求,在必要情况下,对具有畸变的遥感图像进行辐射校正,以消除辐射量失真。

6、几何校正

包括系统几何校正、几何精校正处理。根据数据本身情况以及专题产品库的要求,在必要情况下,对具有畸变的遥感图像进行校正,以消除几何畸变。

7、高程校正处理

根据数据本身情况以及专题产品库的要求,在必要情况下,采用地面控制点和数字高程模型对几何校正模型进行修正,进一步消除高程的影响。

8、坐标系转换

为统一数据坐标系统,需要将遥感数据进行投影转换。所有坐标系统都要求转换为西安1980。

9、图像镶嵌

根据产品规范的需求,需要对部分数据进行镶嵌处理,比如在进行标准景图像数据分幅的过程中,就需要对标准景图像先进行镶嵌处理。

10、图像融合

根据数据本身情况以及林业信息化建设的要求,在必要情况下,通过一个模型,把来自不同传感器的多分辨率的图像集综合到一组图像集中,以提高图像判读的可靠性和对图像的解译能力。

11、编辑

为了满足产品生产的质量要求,需要对图像数据进行一定的编辑工作,包括匀色、滤波、增强等图像编辑操作,通过编辑操作,提高图像数据的质量,能够更好的为其它应用服务。

12、图像分幅

主要分为国家标准分幅和行政区划分幅。

13、数据字典

在数据库建库过程中需要建立数据字典,在原始数据中采集过程中提取出相关数据,建立成数据字典。方便用户以后对数据进行检索。

14、数据编目

要素编目定义了要素的类型、操作、属性和地理数据中的关系。要素编目通过提供数据内容和语义的更多信息而促进了海量地理数据的管理、共享和使用。

15、元数据编制

在本项目数据系统建设中,元数据对数据内容、质量、条件和其它特征的数据进行描述。

数据字典、元数据要素目录和数据目录按照项目要求,使用统一的“采集工具”获取。在加工整理过程中,部分环节会涉及到相关标准规范,规范可能是基础规范或者专业规范,以及更多的是自己制定的实用标准等。涉及的规范将在其被使用的地方进行明确标注,并在数据改造过程中对标准进行评估。同样,数据质量检查工作也是直接穿插到数据改造的实施过程当中。

S12:林业数据整合改造

近年来,由于空间数据引入和监测内容增加,林业资源数据量空前膨胀,林业资源数据库已经成为海量数据库。同时,林业信息化建设不断提出新的应用需求,其应用系统也日趋复杂,由简单的数据处理系统向综合的业务分析系统转变。这些转变给数据库管理、数据存储与处理、应用系统设计与优化以及林业数据资源交换共享带来了挑战。随着林业信息化建设工作的开展,林业数据整合改造已成当务之急。林业林业数据整合改造主要包括林业空间数据的改造和林业文本数据的改造。

S120:林业空间数据整合改造总体方案

整合内容包括数据模型设计、要素提取、格式转换(存储格式)、投影变换、编码转换、编辑处理(图形编辑、属性编辑、接边处理、多级要素连接、数据综合)、质量控制(含标准的一致性和符合性测试)、数据库入库、主要功能定制开发等流程。图2为林业空间数据整合改造流程图。

1、数据内容

对连续清查基础成果数据库、森林资源分布数据进行统一的整合改造。

2、信息提取

根据目标数据模型的要素内容要求,按空间范围或属性内容由源数据中提取相关的要素信息。

3、数据格式转换

将数据格式转换成一致的数据处理格式。

4、数据结构规范化

要素分层命名:将提取的数据进行整理,归并,重新进行要素的分层组织,并依照数据模型规范要素层命名;首先根据图形原则,将空间数据分为点、线、面三种类型;其次是对象原则。例如河流和道路,虽然它们同为线状要素,但是属于不同的地理对象,应当作为不同的数据存储层。我国基础地理信息数据分为测量控制点、水系、居民地、交通、管线与垣栅、境界、地形与土质和植被八个大类,然后再依次细分为小类、一级类、二级类。

数据结构转换:将整理好的数据,进行结构化处理,转换到与目标数据模型相一致,根据目标数据模型的设计,对属性项进行增加或删除,对要素和要素属性项的名称进行重新定义,对属性项的类型进行重新定义。

5、编码转换

行政区划代码转换:依据数据采集或更新年份,选取相应年份的《中华人民共和国行政区划代码》国标码,将行政区划代码进行规范。

空间数据的编码,是指将数据分类的结果,用一种易于被计算机和人识别的符号系统表示出来的过程。编码的结果是形成代码。代码由数字或字符组成,或由它们共同组成的混合码。

6、图形处理

图形错误处理:包括对点、线、面等的增、删、改处理;对被图幅切割为多块的图元进行要素的几何的面向对象组合处理;依照数据质量要求,消除图形的几何错误和空间逻辑关系不一致等错误;

图面信息补充:重新组合处理的数据可能存在图形信息不全,高程点稀少或缺失等情况,要依据参照数据或源数据进行信息补充;

拓扑重构:对重组数据进行编辑处理,重新构建空间拓扑关系;

数据拼接分割:依照最新的《国家基本比例尺地形图分幅与编号》对标准分幅图进行拼接或分割处理;依照数据采集时采取的行政区划编码,根据项目需求进行按行政单元的数据拼接或分割;或根据应用需要,依照相关的行业标准进行图幅的拼接或分割处理,以满足数据加工整理全区域图或重点区域图的需要,并对拼接后的数据进行几何和属性接边处理。

7、属性处理

量纲一致性处理:对重组数据不同要素层的量纲根据项目应用需求进行转换或归一化处理;

属性一致性处理:对存在逻辑关系的林业属性项按照林业专业标准进行关联处理,保证属性的一致性;

属性信息补充:由于数据结构转换,可能存在某些新增属性项没有原始内容等情况,要依照参考数据、源数据进行信息补充或者通过属性项之间的模型分析、统计运算得到。

8、信息综合

当某一个库中,存在因数据抽取造成的数据比例尺不一致时,需要对整合要素的比例尺进行转换,根据应用需求,将不一致的大比例尺数据进行概括综合,通过缩编技术转换成满足项目需求比例尺的数据。该步处理需根据数据实际进行选择性处理。

9、矢量数据栅格化处理

一般在数据产品制作环节需要对矢量数据进行栅格化的数据处理。进行矢量数据带坐标信息的栅格化处理。该步处理需根据数据实际进行选择性处理。

10、入库格式转换

在数据处理完成之后,需要依据项目约定的数据格式要求,进行相应的数据格式转换。

11、空间定位基准标准化

将数据转换成统一的空间参考体系和标准化的时间模式。

坐标转换:非西安1980坐标系数据要转换到西安1980坐标系。

S121:林业文本数据加工整理总体方案

资料文本数据现状

林业文本数据以纸质载体为主,长期以来,林业调查和管理采用计算机辅助与手工操作相结合的方式,造成了林业调查的数据大部分是传统的纸质材料,它不能满足林业信息化建设的技术要求,必须先通过数字化加工处理,转换成电子档案文本,在此我们要对这些纸制数据进行数字化加工处理。

资料文本加工整理流程

对于资料文本数据,我们也采用标准化的信息采集录入过程,再将整理好的电子资料数据入库,图3为资料文本加工整理流程图。

下面根据不同的林业数据,详细阐述林业数据库整合具体流程设计。

1.1森林资源图像数据库整合技术流程

森林资源图像数据库整合流程步骤为:

(1)对森林资源图像数据库进行数据处理流程设计;

(2)对遥感图像进行预处理,并提取森林资源增强图像数据信息;

(3)将遥感图像数据进行数据融合,并进行数据格式转换、将北京54坐标系转为西安80坐标系;

(5)对数据进行一致性检验,检验合格后生成森林资源图像数据库。

图4为森林资源图像数据库整合技术流程图。

1.2连续清查基础成果数据库

连续清查基础成果数据库整合流程步骤为:

(1)对连续清查基础成果数据库进行数据处理流程设计;

(2)对森林资源连续清查数据进行数据预处理,提取相关的基础信息;

(3)对(2)中提取数据进行格式转换、将北京54坐标系转为西安80坐标系;

(4)对连续清查基础成果数据库进行设计;

(5)按照项目及相关的统一标准规范对要素与属性进行编码;

(6)进行数据编辑处理,将处理后的数据导入设计好的数据库;

(7)进行数据检查和验证,生成连续清查基础成果数据库。

图5连续清查基础成果数据库整合技术流程图。

1.3湿地分布数据库

湿地分布数据库整合流程步骤为:

(1)对湿地分布数据库进行数据处理流程设计;

(2)确定湿地处理单元,整理湿地斑块;

(3)对湿地斑块数据进行格式转换、空间投影信息转换、将北京54坐标系转为西安80坐标系;

(4)对湿地分布数据库进行设计;

(5)进行数据一致性检查,将处理后的数据导入设计好的数据库;

(6)进行数据检查和验证,生成万湿地分布数据库。

图6为湿地分布数据库整合技术流程图。

1.4森林分布专题图像数据库

森林分布专题图像数据库整合流程步骤为:

(1)对森林分布专题图像数据库进行数据处理流程设计;

(2)对森林分布专题图像数据进行数据预处理;

(3)对(2)中数据进行图像精纠正,基于森林资源专题信息完成图像再增强处理,对森林分布图像数据进行重新分类;

(4)对(3)中提取的数据进行格式转换、将北京54坐标系转为西安80坐标系;

(5)进行数据一致性检验,检验合格后生成森林分布专题图像数据库。

图7为森林分布专题图像数据库整合技术流程图。

1.5野生动物信息库

野生动物信息库整合流程步骤为:

(1)对野生动物信息库进行数据处理流程设计;

(2)对野生动物数据进行整理和数据预处理;

(3)对野生动物物种空间数据进行处理;

(4)进行数据格式转换、空间投影信息转换、将北京54坐标系转为西安80坐标系;

(5)采用面向对象的方法对野生动物信息库进行设计;

(6)进行数据一致性检查,将处理后的数据导入设计好的数据库,生成野生动物信息库。

图8为野生动物信息库数据库整合技术流程图。

1.6野生植物信息库

野生植物信息库整合流程步骤及流程图为:

(1)对野生植物信息库进行数据处理流程设计;

(2)对野生植物数据进行整理和数据预处理;

(3)对野生植物空间数据进行处理;

(4)进行数据格式转换、空间投影信息转换、将北京54坐标系转为西安80坐标系;

(5)采用面向对象的方法对野生植物信息库进行设计;

(6)进行数据一致性检查,将处理后的数据导入设计好的数据库,生成野生植物信息库。

图9为野生植物信息库数据库整合技术流程图。

1.7自然保护区分布数据库

自然保护区分布数据库整合流程步骤为:

(1)对自然保护区分布数据库进行数据处理流程设计;

(2)对自然保护区数据进行整理和数据预处理;

(3)对自然保护区空间数据进行处理;

(4)进行数据格式转换、空间投影信息转换、将北京54坐标系转为西安80坐标系;

(5)对自然保护区分布数据库进行设计;

(6)进行数据一致性检查,将处理后的数据导入设计好的数据库,生成自然保护区分布数据库。

图10为自然保护区分布数据库整合技术流程图。

1.8天然林保护工程建设数据库

天然林保护工程建设数据库整合流程步骤为:

(1)进行天然林保护工程建设数据库数据处理流程设计;

(2)导入各县(局)天然林保护工程建设数据;

(3)各县(局)天然林保护工程建设信息提取和过滤;

(4)将XLS、DBF数据格式转换为Oracle数据格式、将北京54坐标系转为西安80坐标系;

(5)对天然林保护工程建设数据库进行设计;

(6)按照项目及相关的统一标准规范对天然林保护工程建设数据进行编码转换;

(7)完成各县图形和属性数据连接,并进行数据一致性检查,检验合格后将处理好的数据导入设计好的数据库,生成天然林保护工程建设数据库。

图11为天然林保护工程建设数据库整合技术流程图。

1.9退耕还林工程建设数据库

退耕还林工程建设数据库整合流程步骤为:

(1)对退耕还林工程建设数据库进行数据处理流程设计;

(2)各县退耕还林工程建设数据预处理;

(3)对(2)中的数据进行格式转换将xls、dbf格式转换成oracle数据格式;

(4)对退耕还林工程建设数据库进行设计,对数据进行标准化处理,将各县图形与属性连接;

(5)进行数据编辑处理,将处理后的数据导入设计好的数据库;

(6)进行数据检查和验证,生成退耕还林工程建设数据库。

图12为退耕还林工程建设数据库整合技术流程图。

1.10林业有害生物发生、防治及灾害信息库

林业有害生物发生、防治及灾害信息库整合流程步骤及流程图为:

(1)对林业有害生物发生、防治及灾害信息库进行数据处理流程设计;

(2)提取虫情发生防治数据及分类数据,对提取的数据进行格式转换,对虫情数据空间投影信息进行投影转换;

(3)对林业有害生物发生、防治及灾害信息库进行设计;

(4)进行数据编辑处理,将处理后的数据导入设计好的数据库;

(5)进行数据检查和验证,生成林业有害生物发生、防治及灾害信息库。

图13为林业有害生物发生、防治及灾害信息库数据库整合技术流程图。

1.11森林植物及其产品检疫数据库

森林植物及其产品检疫数据库整合流程步骤为:

(1)对植物检疫管理数据库进行数据处理流程设计;

(2)提取检疫对象及检疫法规数据,对提取的数据进行格式转换、标准化转换;

(3)对植物检疫管理数据库进行设计;

(4)进行数据编辑处理,将处理后的数据导入设计好的数据库;

(5)进行数据检查和验证,生成森林植物及其产品检疫数据库。

图14为森林植物及其产品检疫数据库整合技术流程图。

1.12有害生物防治管理数据库

有害生物防治管理数据库整合流程步骤及流程图为:

(1)对有害生物防治管理数据库进行数据处理流程设计;

(2)提取林业有害生物基础知识数据、测报点数据及防治技术数据,对提取的数据进行格式转换、标准化转换;

(3)对有害生物防治管理数据库进行设计;

(4)进行数据编辑处理,将处理后的数据导入设计好的数据库;

(5)进行数据检查和验证,生成有害生物防治管理数据库。

图15为有害生物防治管理数据库整合技术流程图。

S2:数据融合

数据整合涉及到空间分析、属性归属判断、合并后数据检查等诸多技术环节,操作流程繁锁,容易发生错误。

在数据融合之处首先需要确定融合的基础原则和目的,主要是为了确定图形基准和属性的归属,如“图形数据以林地一张图为基准,属性数据是结合两套数据空间和逻辑分析结果,实现最大限度合理化”。

将整个数据融合工作分为数据规则制定、数据融合处理和数据成果验证3个阶段,其中数据规则制定是决定数据融合质量的重要步骤。

(1)数据融合规则制定

数据融合规则制定包括两方面的内容,一是空间数据基准,确定空间数据的基准图层,以及当数据之间存在冲突(重叠)时,空间数据的取舍,这里需要考虑空间数据的年限问题;二是属性归属判断,在确定了空间数据的基础上,确定保留的属性数据规则,需要注意属性数据之间的主从关系,如资源数据,在确定地类后,方可确定资源数据相应空间位置的数据哪些属性可以补充进来。

(2)数据融合处理

在确定数据融合规则后,可采用适当的工具对数据进行处理。在数据融合处理前,可先选取实验区进行试验处理,经过验证确认后,在进行推广。

(3)数据成果验证

通过逻辑检查来判断标准化后的数据是否符合相关技术规程要求。逻辑检查条件可根据实际需要增加或减少。

在数据融合的过程中,还包括对地图数据精度控制过程,具体包括:

1、地图转绘中的精度控制

为了保证数据录入精度,要求纸质地图没有变形、霉变、破损;地图中边界要保证在扫描后电脑显示清晰可见,可用铅笔对边界进行加粗处理;为便于控制点的采集,要保证地形图的内、外图廓线清晰。

2、地图扫描的精度控制

扫描精度为0.05%,失真率小于0.1%,扫描分辨率为300-500dpi,保存为tiff格式。进行地图扫描时,无限制的提高分辨率是不可取的;分辨率太低则误差较大,会出现断线、空白等现象。300dpi的地图大小为8-9M,400dpi的地图大小为15-16M,在电脑内存允许的情况下,保证地图的清晰度,数据采集采用分辨率为400dpi。

3、扫描后纠正图的精度控制

首先要对扫描图进行图廓点采集,采集4个内图廓点、4个外图廓点。采集图廓点完毕后,需要对控制点进行精度评估,各控制点图上误差<0.5mm,即实地均方差X方向<5m:Y方向<5m;标准网格线与地图公里网格完全套合;最后进行整体纠正,并将纠正好的单图幅地图数据保存。

S3:按照预定策略对融合后的数据进行审核和质量检查。具体包括:

S31:数据审核

数据审核方式主要包括空间数据审核、属性数据审核、空间数据与属性数据关联关系审核等。

1、空间数据审核

通过建立拓扑关系进行空间关系审核,如在空间关系上,要求小班之间无交叉、无包含(岛除外)、无缝隙、无空洞、无悬挂;要求小班与林场、林场与乡镇、乡镇与市县、市县与省域严格包含关系、界限叠加无缝隙,准确接边。

2、属性数据审核

通过逻辑关系检查判断是否符合相关要求,逻辑检查条件可根据实际需要增加或减少。

3、空间数据与属性数据关联关系审核

通过对空间数据和属性数据建立关联关系,验证空间数据和属性数据之间一对一、一对多或多对一的关联关系。

S32:数据成果质量检查

1、质量要求

以数据质量标准为依据,检查数据的完整性、位置精度、时间准确度分类正确性以及元数据的检查。

2、质量检查内容与方法

2.1矢量数据质量检查

根据数据的实际情况,采用自动批量或人机交互的方法进行检查。对能够通过数据分析,提炼出一般检查规则的检查项进行自动批量检查。对于数据不确定性强,规律不易把握的检查内容进行人机交互式的检查,并进行结果记录,具体检查内容及要求见下表:

表2矢量数据检查内容表

2.2遥感影像数据质量检查

在影像入库之前对数据进行质量检查,保证进入到库中的数据满足要求,主要检查内容如下表:

表3影像数据检查内容表

2.3统计型数据质量检查

根据统计型数据的具体情况,可以通过自动和的方式对数据结构的正确性和规范性、数据内容的正确性、编码的一致性等进行检查并记录,具体检查内容见下表:

表4统计数据检查内容表

S4:数据入库

1、数据库逻辑设计

数据库逻辑设计主要是将数据库设计阶段的概念数据库转换为逻辑数据库模式。本设计基于关系模型和关系数据库管理系统,设计步骤如下:

(1)形成初始关系数据库模式,即直接由概念数据库模式生成关系数据库模式。

(2)关系模式规范化,即把一个给定关系模式转化为遵循关系模式的规范形式(范式)的过程,具体参照第一范式(最基本的要求)、第二范式、第三范式、BCNF范式。

(3)关系模式优化,是将规范后的关系数据库模式进行优化以提高数据操作的效率和存储空间的利用率,主要包括水平分解(将关系分为若干个子关系)和垂直分解(将共同的属性分解出来形成子关系)两种方法。

(4)定义关系上的完整性和安全性约束,主要包括属性和关系模式上的完整性与约束性,其中数据库的安全性定义必须满足用户的要求定义,主要是各表的主键(PK)和外键(FK)的设置。

(5)子模式定义,模式逻辑的子集,主要是用来规范各类数据的定义,按照分类好的数据以统一的标准定义,主要包括子模式首部(模式依赖的模式名并定义子模式名)和子模式结构定义(模式数据结构)部分。

(6)性能估计,对已经设计完成的逻辑数据库的时间复杂性和空间复杂性进行估算,依据估算出来的结果对软硬件环境数据库设计,一般用逻辑记录的存取数、信息传输量和存储空间等三个测度来估计逻辑数据库的性能。

图16为数据库逻辑设计结构图。

数据库总体逻辑设计根据空间数据概念上的划分,首先分为基础地理数据库、林业专题数据库等,这些数据根据表达的地理信息方式的不同,分别采用矢量存储和栅格存储的方式,不同的空间数据的表达方式采用不同的空间索引方式,分别采用多级空间索引和影像金字塔索引的方式,空间元数据可作为单独的逻辑单元,描述和管理整个空间数据库。

在每个空间数据库中首先采用一定的分区机制、如行政区划分、流域区域划分的方式将空间数据进行逻辑分区,在每个分区“目录”下,我们又可以根据专题或者图层表达的空间数据内容的不同进行分层管理。中心空间数据库的分区、分专题、分层的逻辑设计方式可以利用先进的Geodatabase逻辑建模技术来实现,在面向对象的空间数据库Geodatabase中将林业应用数据划分为逻辑大小不同的空间数据库逻辑单元,包括空间数据库、特征数据集、对象、特征、子类、约束规则、影像(栅格)数据等。

2、数据库逻辑划分

(1)空间数据集

空间数据集是林业信息化交换中心空间数据逻辑设计中的最大的逻辑单元,将采用Geodatabase来存储和管理。它是大型关系型数据Oracle中用于存放空间数据的一个仓库(Repository),也就是说它是包含空间数据的一个关系型数据库,Geodatabase中包含矢量数据、栅格数据、表格、关系等地理对象。

(2)特征数据集

特征数据集是按照专题或地理范围定义的,具有相同参考的特征类的集合,是数据逻辑划分的主要管理单元,它不只是数据库中的“目录”,同时在特征数据集中的特征或者对象,相互之间可以发生一定的关系,包括几何网络关系、平面拓扑关系、属性关系、构成关系、关联关系等。

(3)对象、特征、子类

数据库的基本单元由对象和特征组成,对象是具有属性和行为的实体,对象是对象类的实现,对象类中的所有对象具有相同的属性和行为;特征是对象的特例,是一种对象,是特征类的实例,特征具有位置信息,其位置信息存储于几何类型的属性字段中,特征可以参与网络和拓扑关系运算;子类型:通过一个子类型字段的值来定义子类型,将对象类中的对象划分成组,所有的子类型具有相同的属性模式、相同的行为模式、每个子类型字段可以有不同的缺省值和值域。

2.1矢量数据逻辑设计

在公共基础数据库、林业基础数据库中的数据大部分是二维的矢量图形数据,这些矢量数据根据不同的分区,不同的专题特征进行分类组织,在空间数据库中矢量数据是以一种分区、分层的组织形式进行管理的,这些空间数据根据它们的特征码(用户码)与其它林业业务属性信息或者关系型数据库中的数据进行关联。以森林资源规划设计调查专题图为例来说明GIS是如何进行矢量数据组织和分层管理的。整个一个林业专题空间数据库称为一个Geodatabase,按照森林资源规划设计调查、森林防火、有害生物防治的数据专题的不同,又可分为不同的空间特征数据集Geodataset,在森林资源规划设计调查数据空间特征数据集中,又可按逻辑分区将森林资源规划设计调查专题数据进行分组和再组织,使每个辖区对应于一个Geodataset,某地区森林资源规划设计调查专题图就可分为获辖区一Geodataset、辖区二Geodataset,辖区三Geodataset等。如果可能的话,可以将整个辖区基础地理数据放入一个Geodataset,而辖区的树种资源专题数据也可以归为另外一个Geodataset。每一Geodataset代表一块分区数据集,在Geodataset数据集中保存着按照不同专题内容分层的矢量图层数据(Feature),如林相分布图、森林资源分布图、树种资源分布图、森林土壤类型图等,这些图层数据按照图形的表现方式的不同,又可以分为点层、线层、面层和注记层等基本空间数据逻辑单元,在每个空间数据的逻辑单元可以给定一些空间约束规则或者方法,使其成为具有空间行为的“活”的空间对象。按照各种林业资源支持应用的不同,从这些空间数据库中抽取不同的图层数据,按照专题在逻辑上可以任意的组织成一个逻辑的层(Layer),形成叠加的专题图层可以为GIS、WebGIS系统提供查询、空间分析和辅助决策服务。

2.2栅格数据逻辑设计

在智慧林业建设中,影像数据的应用大体上可被分为遥感监测和评估应用、三维可视化分析应用和GIS背景数据的应用几个方面,这些应用又可按照森里资源规划设计调查、公益林管理、有害生物防治、湿地保护等专题的不同,分为不同的栅格数据集,面向不同的应用方向其影像数据的管理方式又可分为栅格编目和无缝镶嵌两种管理方式。其中遥感分析应用处理的影像多是原始单幅或者单景卫星影像,其管理方式可采用栅格编目的方式,或者是经过几何纠正或正射校正处理的卫星影像,其管理方式可采用无缝镶嵌的方式;面向三维可视化应用的影像,一般要求是经过几何纠正或者正射校正处理的连续的拼接良好的大幅高分辨率卫星影像或者航片,当然也包括连续的DEM数据,它们的管理方式可以是无缝镶嵌的方式,这就管理方式影像检索和下载的速度快,有利于客户端三维可视化漫游分析的应用;面向GIS背景的影像数据要求也是要拼接良好的卫星或者航片,其管理方式也采用无缝镶嵌的方式。另外,遥感分析处理多只是对感兴趣区的影像进行处理,其处理结果的物理连续性不是很好,管理方式也多采用影像编目的方式。图17为栅格数据库逻辑结构示意图。

3、数据入库

按数据库相关标准规范,对已有的各类林业资源数据实施“二重质检、三重入库”的数据规整、质检、建库过程。图18为林业资源数据整合入库流程图。

本发明有益效果为:

1)多源异构林业数据资源的集成:还包括对不同类别不同来源的异构数据的集成,通过对异构数据的格式转换、结构转换、坐标转换等完成异构数据的标准化整理,完成林业大数据的集成。

2)解决林业资源数据的孤岛问题:解决以前存在的各种林业资源数据的信息孤岛问题,实现林业信息资源的整合,避免因信息孤岛问题造成的信息闭塞,提高林业信息数据的使用率。

3)建立覆盖林业行业的信息化应用的数据支撑体系:开展公共基础数据、林业基础数据、林业综合数据、林业专题数据、林业信息产品数据的整合建设,建立覆盖林业行业的信息化应用的数据支撑体系,并实现对数据的管理、交换与共享服务,全面拓展和提升林业信息化应用的范围和水平,提高林业信息资源共享能力,并可面向大众提供全面、快捷、准确、特色的信息服务,扩大林业信息化的层面,为决策支持和应急处理提供数据基础。

以上对本发明所提供的基于一张图的林业大数据建设方法进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号