法律状态公告日
法律状态信息
法律状态
2014-03-19
未缴年费专利权终止 IPC(主分类):G06F17/30 授权公告日:20121121 终止日期:20130124 申请日:20110124
专利权的终止
2012-11-21
授权
授权
2011-07-20
实质审查的生效 IPC(主分类):G06F17/30 申请日:20110124
实质审查的生效
2011-06-01
公开
公开
技术领域
本发明涉及一种检索方法,具体涉及多源遥感资源的异构数据库的检索方法。
背景技术
遥感一般指运用传感器对物体的电磁波的辐射、反射特性的探测,并根据其特性对物体的性质、特征和状态进行分析的理论、方法和应用的科学技术。遥感资源一般是指采用航空、航天运载工具,通过传感器获得的不同数据类型(可见光、多光谱、高光谱、SAR及红外等)、不同时相及不同分辨率(包括时间分辨率、空间分辨率、光谱分辨率)的数据及对数据和成像过程的相关描述信息。遥感资源现已广泛应用于环境监测、区域规划、气象预报、水环境治理与规划、资源清查与监测、通信网络规划、数字地球等相关的领域。
传统的遥感资源数据库检索往往只是针对单个遥感资源数据库。随着遥感技术的发展,往往需要管理不同的遥感资源数据库,这些数据库的结构往往不同,因此被称为异构数据库。如今,遥感资源成爆炸式增长态势。如何整合多个遥感数据库,提高遥感资源的利用效率,需进行遥感资源的跨库检索。针对此问题,提出遥感资源异构数据库的跨库检索方法。并针对遥感资源的海量数据检索,提出分级检索策略,以此提高数据检索速度。
发明内容
针对传统遥感资源不能跨库检索的问题及检索速度较慢的问题,本发明提出一种多源遥感资源异构数据库的分级检索方法。
本发明所述的多源遥感资源异构数据库的分级检索方法的具体过程为:
步骤一:对分布的各个异地遥感数据中心中的数据库的统一化,并将统一化之后的所有数据存入到本地数据库;
步骤二:对本地数据库中的所有数据进行分级检索;
步骤三:将步骤二获得的检索结果进行排序,获得最终的检索结果。
所述步骤一的过程为:
首先,分别从各个分布的遥感数据中心获得遥感数据;
然后,逐一对获得的每一个遥感数据中心的遥感数据进行分析,并通过格式转换器对所有遥感数据中心的遥感数据的格式进行统一化转换,使得所有遥感数据中心的遥感数据转换后的格式与本地遥感数据的格式相同;
最后,把所有格式转换完以后的遥感数据存入本地的遥感数据库中。
所述步骤二中所述的分级空间检索的过程为:
首先,获得用户的查询请求,对请求进行解析并获得查询条件中的属性查询部分和空间查询部分;
然后,对本地数据库中的所有遥感数据进行一级过滤,其中一级过滤也称为粗过滤,获得符合属性查询条件的属性过滤数据集;
最后,对获得的属性过滤数据集进行二级过滤,其中二级过滤也称为空间过滤,获得空间过滤数据集,所述空间过滤数据集极为检索结果数据集。
本发明针对多源遥感资源的异构数据库的检索提供了一种方法,具体涉及到遥感资源异构编目数据库的统一化、数据库空间查询的分级检索及检索结果的优化三部分。
本发明的分级检索方法,首先,针对目前不同类型的遥感数据库,设计统一的编目信息数据库,并把异构的编目信息进行标准化的转换,为后续的检索提供基础。其次,针对遥感数据的空间查询计算量大,为减小计算量,采用初级过滤和二次过滤两级的检索策略。最后,对检索的结果进行优化排序,把质量高的检索结果优先呈现给用户。该方法通过编目数据的统一化和空间查询的分级化实现了高效、稳健的遥感资源异构数据库的空间查询。
本发明所述的分级检索方法适用于遥感资源的检索领域,尤其适用于涉及到多个遥感资源数据库的跨库检索。本发明的分级检索方法还可以应用于对数据库检索结果的排序领域。
附图说明
图1为本发明所采用的整体流程图;
图2为遥感资源异构数据库的转换框图;
图3为统一化后本地数据库的表结构图;
图4分级检索流程图。
具体实施方式
具体实施方式:参见图1说明本实施方式,本实施方式所述的多源遥感资源异构数据库的分级检索方法的具体过程为:
步骤一:对分布的各个异地遥感数据中心中的数据库的统一化,并将统一化之后的所有数据存入到本地数据库;
步骤二:对本地数据库中的所有数据进行分级检索;
步骤三:将步骤二获得的检索结果进行排序,获得最终的检索结果。
步骤一主要是为了把分布式的异构的遥感资源进行格式的统一化及标准化,从而实现分布式异构遥感资源能够协同服务。遥感资源异构数据库是用于存储遥感资源的数据库,所有遥感资源异构数据库的地统一化及标准化过程参见图2所示。
上述步骤一的过程为:
首先,分别从各个分布的遥感数据中心获得遥感数据;
然后,逐一对获得的每一个遥感数据中心的遥感数据进行分析,并通过格式转换器对所有遥感数据中心的遥感数据的格式进行统一化转换,使得所有遥感数据中心的遥感数据转换后的格式与本地遥感数据的格式相同;
最后,把所有格式转换完以后的遥感数据存入本地的遥感数据库中。
例如,本地数据库的数据格式可以为图3所示结构。分布式的异构的遥感数据经上述处理之后,实现了分布异构遥感数据格式的统一化,这样更有利于数据的检索,使检索速度得到了大大提高,并且实现了多个分布异构数据中心的协同服务。
步骤二中所述的分级空间检索的过程参见图4所示,具体过程为:
首先,获得用户的查询请求,对请求进行解析并获得查询条件中的属性查询部分和空间查询部分;
然后,对本地数据库中的所有遥感数据进行一级过滤,其中一级过滤也称为粗过滤,获得符合属性查询条件的属性过滤数据集;
最后,对获得的属性过滤数据集进行二级过滤,其中二级过滤也称为空间过滤,获得空间过滤数据集,所述空间过滤数据集极为检索结果数据集。
所述一级过滤,主要是通过用户提交请求中的属性条件对本地数据库中的海量空间遥感数据进行属性查询,并得到满足用户请求中的属性要求信息的属性过滤的数据集。
所述二级过滤,主要是在一级过滤基础之上的空间过滤,所述空间过滤方法可以采用射线法实现。
上述一级过滤的过程为:
从用户请求中获得空间查询条件,即:经纬度坐标点集,并把该空间查询条件存入点集M中;然后,从本地数据库中获得所有满足属性条件的记录的地理信息组成点集N。
该点集中存储的是所有符合属性条件的经纬度坐标点;
上述二级过滤的过程为:
逐一判断由点集M构成的多边形A的每个顶点P(x,y)与由点集N构成的多边形B的几何关系,当多边形A的所有顶点中,有一个顶点与多边形B相交、相邻或位于多边形B内部时,则判定多边形A与多边形B的几何关系为相交,并把多边形A中所有与多边形B相交、相邻或位于多边形B内部的顶点对应的遥感数据记录保留于空间过滤数据集中,获得空间过滤数据集。
判断多边形A的任意一个顶点P(x,y)与多边形B的几何关系的过程为:
如果顶点P(x,y)在多边形B上,则判定多边形A与多边形B相交或相邻;如果顶点P(x,y)不在多边形B上,则采用射线法判定多边形A与多边形B的几何关系,具体过程为:以顶点P(x,y)为顶点做一条射线l,计算射线l与多边形B的各边是否相交,并计算出交点个数a,当个数a为奇数时,则顶点P(x,y)在多边形B的内部,判定多边形A与多边形B相交,返回TURE;当个数a为偶数时,则顶点P(x,y)在多边形B的外部。
所述偶数包括0。
在射线法中,当射线l与多边形B的某一条边重合时,为不相交状态。
与一般的数据库信息系统相比,遥感空间数据库的遥感数据具有数据量大、数据类型复杂、空间检索计算量大等特点。针对遥感数据的以上三个特点与为用户提供快速检索服务的要求,本文提出了基于两级过滤的检索策略来实现遥感空间数据的快速检索服务,其中,一级过滤为属性查询,二级过滤为空间过滤。
具体实施方式二:本实施方式与具体实施方式一的区别在于,该方法中还包括:定时周期性的获取各个分布式的数据中心的数据对本地数据库进行更新的步骤。
由于分布式的各个数据中心的数据每天或每周进行相应的更新操作,为了让用户能够获得最新的遥感数据。本实施方式中增加了用于实现数据更新的步骤,该步骤用于定时获取异构遥感资源数据库的更新资源,该步骤采用定时器编程实现,可以对更新时刻及更新时间间隔进行相应的参数调整,这样就可以在特定时刻和特定间隔周期获取分布式的各个数据中心的数据实现对本地数据库的更新,从而使本地数据中心与各个分布的数据中心的同步,让用户可以获得最新的数据。
具体实施方式三:本实施方式与具体实施方程一或二所述的方法的区别在于,该方法还包括都空间过滤数据集中的所有数据进行优化排序的步骤,然后将优化排序后的空间过滤数据集作为最终检索结果输出。
在实际的搜索过程中,众多研究者发现用户不仅关心搜索结果的正确性,另外搜索结果的排序也很大程度地影响用户的搜索体验。当检索结果中的每个文档根据自身的相关性和重要性被赋予合理的分值作为排序依据时,返回的查询结果是令人满意的;反之,如果检索结果中文档的评分结果缺乏合理性,将产生较差的用户体验。
所述优化排序的步骤中,根据遥感数据的实际需要,综合考虑数据质量,即:云覆盖程度、分辨率、时间等参数提供检索的结果进行排序。
在排序过程中建立一个权重可调整的质量评价模型,对每个检索结果打分,在检索过程中通过此模型的过滤,将分数较高的结果优先反馈给用户。
结合遥感数据的特点建立如下评分模型:
Score=f(CloudLever)×Weight1+g(Date)×Weight2+h(Resolution)×Weight3
其中,weight1+weight2+weight3=1,所述weight1、weight2和weight3分别是云覆盖程度、日期和分辨率的权重参数。
CloudLever表示云覆盖程度,Date表示日期,Resolution表示分辨率;
f(CloudLever)表示云覆盖程度的函数,
f(CloudLever)=100-20×(CloudLevel),CloudLever为0~5,6个等级;
g(Date)表示日期的线性函数,
g(Date)=100-100×(SystemData-ImageData)/(SystemData-OldestDate);
其中,ImageData是卫星影像的日期,SystemData是检索当天的日期,OldestDate是卫星影像中最早的日期;
h(Resolution)表示分辨率的线性函数,
h(Resolution)=
100-100×(MaxResolution-ImageResolution)/(MaxResolution-MinResolution),
其中,ImageResolution是卫星影像的分辨率,MaxResolution是分辨率的最大值,MinResolution是分辨率的最小值。
上述模型具有特点:总体采用线性模型,分数在0~100之间;各项质量的分数在0~100之间,各项也采用线性打分;各项的权重可调。
机译: 异构多媒体数据库的综合检索方法
机译: 异构多媒体数据库的综合检索方法
机译: 整合异构数据资源的全球数据库管理系统