首页> 中国专利> 一种可扩展定义的时空数据统一组织方法

一种可扩展定义的时空数据统一组织方法

摘要

一种可扩展定义的时空数据统一组织方法,包括以下步骤:步骤A:根据高分时空数据特征分析,建立自适应扩展的元数据抽象模型;步骤B:高分元数据和实体数据的网格编码和组织关联;步骤C:基于GML规范的可扩展高分时空数据组织,针对不同数据来源的格式自定义多个GML文档大纲,实现GML格式集成的高分时空数据接口;以及步骤D:可视化实现可扩展定义的元数据和实体数据组织建模。

著录项

  • 公开/公告号CN106909645A

    专利类型发明专利

  • 公开/公告日2017-06-30

    原文格式PDF

  • 申请/专利权人 中国科学院电子学研究所;

    申请/专利号CN201710092427.2

  • 申请日2017-02-21

  • 分类号G06F17/30(20060101);

  • 代理机构11021 中科专利商标代理有限责任公司;

  • 代理人方丁一

  • 地址 100190 北京市海淀区北四环西路19号

  • 入库时间 2023-06-19 02:44:13

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-03-26

    授权

    授权

  • 2017-07-25

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20170221

    实质审查的生效

  • 2017-06-30

    公开

    公开

说明书

技术领域

本发明涉及时空数据处理领域,特别涉及一种可扩展定义的时空数据统一组织方法。

背景技术

当前高分系统信息化建设面临着数据类型复杂,种类繁多的问题,各类数据产品具有来源多,数据量大,更新快,结构化、非结构化数据并存,实时数据的产生承随机、零散或脉冲式等特点,传统数据组织无法适应数据的大量脉冲式涌入带来的存储读写压力和容量扩展性问题。同时随着系统的不断扩展与完善,还会有新的数据类型和数据格式进入到系统中,这为高分时空数据的统一组织管理带了很大挑战。现有的多源数据集成的方式大致有三种:数据格式转换模式、数据互操作模式、直接数据访问模式,但仍然面临着信息来源复杂、管理多样、数据格式不兼容的瓶颈问题。

元数据是专门用来描述数据的特征和属性的,也被称为是关于数据的数据,使数据加工达到规范化,促进科学数据资源的标准化,从而加强数据交流与共享,这为解决上述挑战提供了一条重要的可行途径。但现有的元数据标准,不能适应多源异构高分时空数据的动态扩展、统一组织与管理。目前,开放GIS联盟(open GIS consortium,OGC)在其已创建的公共地理模型(OGC抽象规范)基础上,通过封装地理信息及其属性,制定了符合地理空间数据组织特点的可扩展标识语言(extensible markup language,XML)扩展集—地理标识语言(geography markup language,GML),并已经成为事实上的网络地理空间数据交换标准。GML是一种非常实用的GIS数据的元数据定义语言,针对于GIS数据的元数据组织有着先天优势。

现有高分时空数据不仅仅是遥感和GIS数据,需要综合考虑其他数据类型的特点。在统一的地理空间框架基准下,考虑构建一体化的元数据规范,消除和屏蔽元数据和数据格式上的差异。借鉴GML的优势,以元数据和实体的形式进行模型表示,该模型具有高可扩展性,突破可扩展定义的元数据组织的局限,满足对新加入的其它类型元数据的管理。实现数据的自组织。提供数据管理与维护工具,动态可扩展容量,实现对各异构多源高分时空数据统一管理。

发明内容

鉴于现有方案存在的问题,为了克服上述现有技术方案的不足,本发明提出了一种可扩展定义的时空数据统一组织方法。

根据本发明的一个方面,提供了一种可扩展定义的时空数据统一组织方法,包括以下步骤:步骤A:根据高分时空数据特征分析,建立自适应扩展的元数据抽象模型;步骤B:高分元数据和实体数据的网格编码和组织关联;步骤C:基于GML规范的可扩展高分时空数据组织,针对不同数据来源的格式自定义多个GML文档大纲,实现GML格式集成的高分时空数据接口;以及步骤D:可视化实现可扩展定义的元数据和实体数据组织建模。

从上述技术方案可以看出,本发明具有以下有益效果:

采用基于共性和个性特征定义的动态可扩展元数据模型可以对不同类型高分时空数据进行统一描述。数据的个性属性支持自定义扩展,数据类型间能够继承和派生,实现了多源异构数据的动态扩展、统一组织与管理。

高分时空数据类型多且不易统一管理和融合,规定了统一的编码规则,并利用GML数据格式进行整合。

完成对各类元数据和实体数据的编辑、扩展,利用数据之间的继承与泛化关系,通过GUI的形式直观地实现高分时空数据模型的构建、编辑、修改、扩展等全生命周期的管理。

附图说明

图1是本发明实施例可扩展定义的时空数据统一组织方法的流程示意图;

图2是可扩展定义的元数据模型图;

图3是图1步骤A的流程示意图;

图4是图1步骤B的流程示意图;

图5是图4步骤C的流程示意图;

图6是图1步骤C中GML数据文档集成流程示意图;

图7是图1中步骤D的流程示意图;

图8是图1步骤D中实体数据创建、编辑界面图。

具体实施方式

本发明某些实施例于后方将参照所附附图做更全面性地描述,其中一些但并非全部的实施例将被示出。实际上,本发明的各种实施例可以许多不同形式实现,而不应被解释为限于此数所阐述的实施例;相对地,提供这些实施例使得本发明满足适用的法律要求。

在本说明书中,下述用于描述本发明原理的各种实施例只是说明,不应该以任何方式解释为限制发明的范围。参照附图的下述描述用于帮助全面理解由权利要求及其等同物限定的本发明的示例性实施例。下述描述包括多种具体细节来帮助理解,但这些细节应认为仅仅是示例性的。因此,本领域普通技术人员应认识到,在不悖离本发明的范围和精神的情况下,可以对本文中描述的实施例进行多种改变和修改。此外,为了清楚和简洁起见,省略了公知功能和结构的描述。此外,贯穿附图,相同附图标记用于相似功能和操作。

为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。

本发明提供了一种可扩展定义的高分时空数据统一组织方法,在统一的时空参考框架下,利用元数据对不同类型数据的共性属性进行统一描述,解决多类型数据不易统一管理和融合的难题。图1为本发明实施例中可扩展定义的高分时空数据统一组织方法的流程,如图1所示,可扩展定义的高分时空数据统一组织方法包括以下步骤:

步骤A:根据高分时空数据特征分析,建立自适应扩展的元数据抽象模型。

解决了多类型高分时空数据不易统一管理和融合问题,如图2所示。对图像、数值、空间产品、非结构化数据等时空数据,抽取文字描述和其他信息。提取各类共性属性,也提取可扩展特征做为个性属性,进行统一数据抽象。提供统一访问、数据关联和分类管理。

本步骤具体包括如下步骤,如图3所示:

子步骤A1:高分数据特征分析;

针对通用产品、专业处理产品、应急应用产品的元数据进行统一组织,将数据格式、质量、处理方法和获取方法等细节特征分为共性和个性。

子步骤A2:将不同类型高分时空数据的共性属性进行描述;

在统一的时空参考框架下,涵盖所需处理的所有传感器数据、中间结果数据等,将不同类型高分时空数据的共性属性进行描述,对于共性信息中属于数据结构化和非结构化部分,制定规范的元数据格式,以数据库表的形式进行存储管理数据编目存储。

子步骤A3:支持数据个性属性的自定义扩展。

在元数据抽象模型上动态引接,数据类型支持继承派生,实现了数据的统一组织。对于不符合格式的数据输入需要通过格式化导入工具实现数据格式的统一,保证自动处理的时效性。

步骤B:高分元数据和实体数据的网格编码和组织关联。

在抽象模型描述基础上,对高分时空数据进行动态地理网格编码,对元数据和实体进行配置、编辑、多维关联。

本步骤中,动态地理网格编码是通过目标对象的密集程度确定所需要的网格尺度,如地物稀疏的地方只需要粗网格,而地物密集的地方则按细网格存贮空间与非空间数据,提高空间位置检索的效率。本步骤具体包括以下步骤,如图4所示:

子步骤B1:元数据和实体数据动态网格编码;

加载区域地图,按不同经纬网格大小将全球、全国范围划分为不同粗细层次的网格,每个层次的网格在范围上具有上下层涵盖关系,以某种规则对空间数据结构分级编码。动态调整地图缩放比例,将地理空间定位和地理特征描述关联起来,以网格单位作为基本分辨率,控制在允许的误差范围内。有利于输入影像检索条件(框选或多边形选择区域)以及后续结果排序。

子步骤B2:定义可扩展的元数据组织模型,关联元数据和实体数据。

关联内容包括:

a)时间关联:在时间属性维度上建立对地观测数据之间的关联关系,包括时间属性关联、时间临近关联、时间间隔关联、时间运算关联等。数据时间属性不能为空值,时间属性的存储格式、数据类型按HZB/GF 4008-2014规定执行。

b)空间关联:在数据的空间属性维度上建立数据之间的关联关系,包括空间邻近关联、空间隶属关联、空间运算关联等。数据空间属性不能为空值,空间属性的存储格式、数据类型安HZB/GF 4008-2014规定执行。

c)对象关联:根据观测对象建立数据之间的关联关系,包括对象分类关联、对象隶属关联、对象标签关联、对象特征关联、对象电磁特性关联等。数据可以不包含地物对象。

d)内容关联:根据数据所包含的内容进行数据之间的关联,通常会以特征向量的形式表示数据的内容,包括语义特征向量、颜色特征向量、形状特征向量、文本特征向量、信号特征向量等。

定义数据关联规则,把时间、空间、对象分类作为关联数据的基本属性,数据的关联关系可以定义为如式(1)的五元组

S=<ARt,ARs,ARo,TF,SF>(1)

其中,ARt,ARs,ARo是一组关联规则,能够表达为一组逻辑推演规则,例如,由条件X推导出断言Y,用X→Y表示。ARt是时间维度的关联规则,ARs是空间维度的关联规则,ARo是基于观测对象的关联规则。TF是时间特征,如数据的生命周期,时间标识等,SF是空间特征,如数据的空间位置,区域范围等。通过贝叶斯学习,完成关联关系模型的更新,引入序号n以Θn表示当前步骤n的遥感数据间关联关系的状态,以Xn={x1,x2…xn}表示当前数据集,以P(Θ0)表示关联模型初始状态的概率测度,假设Xn集内数据相互独立,则有后验概率

其中,P(Θn)表示没有训练数据的先验概率,P(Xn)表示要观察的训练数据的先验概率,P(Xnn)表示假设Θn成立的情况下观察到数据Xn的概率。考虑到数据的相互独立性,则有P(xn|Xn-1n)=P(xnn),P(xn|Xn-1)为归一化常数,则有可以得到下式:

条件概率P(xnn)表示当前观测数据xn的似然度,P(Θn|Xn-1)表示当前学习步骤的先验概率,且当n=1时该先验概率为初始概率P(Θ0)。根据每次学习的后验知识得到下一次学习的先验知识,从而通过知识传递构成无限循环的状态更新过程。表示为:

至此形成一个递推形式的转移过程,表示了关联关系状态的学习与更新过程。

步骤C:实现基于GML规范的可扩展高分时空数据组织,针对不同数据来源的格式自定义一些GML文档的大纲(Schema),实现GML格式集成的高分时空数据接口。

随着数据类型的增加,梳理新类型数据在数据分类体系中的位置,对新类型数据进行扩展定义,快速生成。本步骤中,高分时空数据组织是通过数据库的方式实现,具体包括以下步骤,如图5所示:

子步骤C1:首先读取高分时空数据的元数据。高分时空数据可能来自于同一个数据源,也可能来自不同的数据源。在异构平台中,各数据源存在数据表达、数据内容等多方面的差异,实现元数据格式统一。

子步骤C2:根据数据质量控制条件,判断数据是否符合要求,读取高分时空数据实体。

子步骤C3:利用质量转换函数,在GML Schema中定义文档的结构、标记、元素、属性等元数据信息,有效地反映了数据表达的差异,将各Schema绑定在一起,对GML文档的数据信息集成就变成透明了。

子步骤C4:通过XML中XSLT(可扩展样式表转换语言)和XPath技术可以实现Schema的绑定,完成数据文档的集成,实现高分时空数据统一组织,集成实现框图如下图6所示。

步骤D:可视化实现可扩展定义的元数据和实体数据组织建模,包括:元数据类型定义、实体数据定义,数据编辑与扩展。

本步骤包括如下子步骤,如图7所示:

子步骤D1:对观测对象的元数据类型定义和扩展。

在可扩展定义语法的元数据建模时,用户可以创建、编辑修改和删除各类元数据类型和元数据。元数据类型定义模块负责定义元数据类型,相同类型的元数据具有相同的数据结构和管理维护方式。功能包括创建元数据类型;编辑元数据类型;删除元数据类型;对象元数据定义;观测数据的元数据定义。元数据定义的扩展可以分为两个层面:自顶向下的数据衍生和自底向上的数据泛化。可扩展定义语法的元数据建模实现元数据定义的动态可扩展;对象元数据定义的扩展。

子步骤D2:对观测对象的实体数据定义和扩展。

在元数据类型节点下创建数据实体。实体数据定义模块负责预览查看元数据,创建实体数据,编辑实体数据,删除实体数据,数据导入和导出,集成和扩展了实体数据类型的属性结构。可扩展定义语法的实体数据创建、编辑界面如下图8所示。

子步骤D3:高分时空数据模型的编辑、扩展和管理。

数据组织模型通过数据库的方式实现,以GUI的形式直观地实现模型的构建、编辑、修改,显示现有的元数据类型、实体数据、元数据关系,导出可扩展定义的元数据类型和实体数据组织模型。

至此,本发明中的可扩展定义的时空数据统一组织方法介绍完毕。

前面的附图中所描绘的进程或方法可通过包括硬件(例如,电路、专用逻辑等)、固件、软件(例如,被承载在非瞬态计算机可读介质上的软件),或两者的组合的处理逻辑来执行。虽然上文按照某些顺序操作描述了进程或方法,但是,应该理解,所描述的某些操作能以不同顺序来执行。此外,可并行地而非顺序地执行一些操作。

需要说明的是,在附图或说明书正文中,未绘示或描述的实现方式,均为所属技术领域中普通技术人员所知的形式,并未进行详细说明。此外,上述对各元件和方法的定义并不仅限于实施例中提到的各种具体结构、形状或方式,本领域普通技术人员可对其进行简单地更改或替换,例如:

(1)步骤C中的质量控制条件和质量控制函数可以有其他形式。

(2)步骤D中的元数据组织管理模块实现可以仅用相应功能替换。

以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号