首页> 中国专利> 一种全球开放数据库中机场空间位置的验证方法

一种全球开放数据库中机场空间位置的验证方法

摘要

本发明涉及一种使用深度学习的跑道检测对全球开放数据库中机场空间位置的验证方法,包含以下步骤:第一步、机场数据融合——融合OAC、GNO和GNS+GNIS三种全球机场位置数据集以获取更完整的数据集;第二步、深度学习模型训练——训练两种深度学习模型;第三步、机场影像验证——将以上两个已训练的模型结合,验证融合数据集影像中所有机场的位置点。本发明提出的验证方法在测试数据集上表现良好,准确率为95.8%,召回率为95.8%。当结果得分阈值设置为0.65时,全球共29259个机场点位通过验证。同时,对验证结果做了人工抽样校验,本发明对样本的验证精度达到了91%,且速度是人工的15倍。结果显示,本发明可以快速、可靠的辅助验证全球机场空间位置,并为其他遥感目标空间位置验证提供了流程思路。

著录项

  • 公开/公告号CN112395998A

    专利类型发明专利

  • 公开/公告日2021-02-23

    原文格式PDF

  • 申请/专利权人 南京大学;

    申请/专利号CN202011306320.1

  • 申请日2020-11-19

  • 分类号G06K9/00(20060101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);G06F16/587(20190101);

  • 代理机构32245 南京同泽专利事务所(特殊普通合伙);

  • 代理人蔡晶晶

  • 地址 210023 江苏省南京市栖霞区仙林大道163号

  • 入库时间 2023-06-19 09:58:59

说明书

技术领域

本发明涉及一种使用深度学习的跑道检测对全球开放数据库中机场空间位置的验证方法。

背景技术

机场作为重要的交通枢纽,其空间分布与人民生活与社会经济息息相关。得益于现代互联网和信息技术的发展,我们可以从网络上获取开源的地名数据库和专题数据库,比如地名数据库有欧洲的全球数据库GeoNames、美国政府的美国数据库GNIS、美国军方的外国数据库GNS等,机场专题数据库有OurAirports。虽然这些数据库中都含有机场的名称、空间位置等数据,但是他们有着不同的数据组织和分类方式,并且记录内容上既存在重复又相互有补充,所以如何融合多源的地名数据一直受到学者的关注。

通常地名数据的融合是通过规则匹配的方法来实现。近些年来,也有学者提出通过深度学习的方法,由计算机自行提出匹配规则,实现地名数据融合。虽然获取机场的空间位置数据如今已并不困难,但数据的精度却值得商榷。一些研究者用OSM等地图数据来校验地名数据,但是网络地图其本身也存在数据精度问题。所以,验证地理要素的空间位置最好的方法还是通过遥感影像确认。对于带机场来说,空间位置的验证转换为从对应位置的遥感影像中识别机场。

发明内容

本发明要解决的技术问题是:克服现有技术的上述不足,提出一种使用深度学习的跑道检测对全球开放数据库中机场空间位置的验证方法。

为解决上述技术问题,本发明提出一种使用深度学习的跑道检测对全球开放数据库中机场空间位置的验证方法,包括以下步骤:步骤1、机场数据融合——融合OAC、GNO和GNS+GNIS三种全球机场位置数据集,OAC数据集中的机场数据与GNO和GNS+GNIS数据集中的机场位置数据进行匹配,将未能匹配的GNO和GNS+GNIS数据集中的机场数据加入至OAC数据集中,以获取完整的机场数据集;

步骤2、深度学习模型训练——训练两种深度学习模型,第一种是基于YOLO-v3的跑道检测模型,用于检测图像中的跑道,第二种是基于ResNet-101的重分类模型,用于检测结果的重分类,训练过程如下:

1)、样本标注,人工随机选取若干含有机场的影像,并使用多边形对选取影像中的机场进行标注;

2)、数据增广,包含颜色操作和几何操作,颜色操作包含直方图均衡、亮度、对比度增强,几何操作包含旋转、镜像、裁剪、平移增强;

3)、基于YOLO-v3的跑道检测模型训练,通过颜色操作中的直方图均衡、亮度、对比度增强和几何操作中的旋转、镜像、裁剪、平移增强对YOLOv3模型进行训练,再利用该模型对数据库部分点位的影像进行识别,获得初始结果框;

4)、基于ResNet-101的重分类模型训练,对初始结果框进行手动筛选和裁剪划分为正负样本,再通过样本增广之后对ResNet-101模型进行训练;

步骤3、机场影像验证——将以上两个已训练的模型结合,验证融合数据集影像中所有机场的位置点,如果影像中存在一个或多个机场跑道,则该点位通过验证;反之,则该点位并不存在机场,验证分为三步如下所示:

1)、双尺度跑道探测,第一探测器以整幅影像尺度探测大、中型机场跑道;第二探测器以小尺度滑动窗口探测影像中的中、小型机场跑道;两个探测器的探测结果包含有若干候选框,每个候选框具有对应的置信度评分,基于该置信度评分进行非极大值约束,得到置信度评分较高的候选框及其探测器评分score

2)、初始结果再分类,使用已完成训练的基于ResNet-101的重分类模型对初始结果中的候选框进行跑道检测,如果存在跑道则该候选框定为潜在区,并计算分类器评分score

3)、筛选和评分,根据对机场的先验知识和置信度筛选潜在区,如果潜在区中检测到的跑道尺寸不在预设范围内或潜在区的中心坐标偏离机场数据集中待验证点的位置达到预设阈值,则剔除该潜在区,最后综合探测器和再分类器的置信度结果进行评分,评分公式如下:

其中,score

本发明提出的验证方法在测试数据集上表现良好,准确率为95.8%,召回率为95.8%。当结果得分阈值设置为0.65时,全球共29259个机场点位通过验证。同时,对验证结果做了人工抽样校验,本发明对样本的验证精度达到了91%,且速度是人工的15倍。结果显示,本发明可以快速、可靠的辅助验证全球机场空间位置,并为其他遥感目标空间位置验证提供了流程思路。

附图说明

下面结合附图对本发明作进一步的说明。

图1为本发明实例的总体流程图。

图2为本发明实例的全球机场分布和融合数据集实验数据。

图3为本发明实例的训练样本示例,其中(a)未经处理的标记图像;(b)跑道探测器数据增强后的样本;(c-d)正、负样本重分类

图4为本发明实例的检测机场跑道和重分类示意图。

图5为本发明实例两种模型训练的丢失率、准确率、召回率分布折线图。

图6为本发明实例在世界各洲验证机场位置的结果图。

具体实施方式

下面根据附图详细阐述本发明,使本发明的技术路线和操作步骤更加清晰。

本研究融合4个开放获取数据库的机场数据,形成一套更完整的机场空间位置数据库。此套数据库包含全球机场58751个,其中有跑道的机场46290个。从中随机选取500个位置作为验证数据集,并人工对其核实。机场的空间分布如图1所示,包括全球跑道机场位置分布(蓝色),训练数据分布(绿色),验证数据分布(红色)。

如表2所示,机场的位置数据来源于OAC、GNO、GNS、GNIS等开放获取数据库。OurAirports.com(OAC)提供了全球机场信息,包含跑道机场、直升机场、水上机场、热气球平台等多类;GeoNames.org(GNO)与GEOnet Names Serve(GNS)提供了全球地名数据(GNS不提供美国),包含机场、军事机场、直升机场、水上机场等;USGS Geographic NamesInformat ion System(GNIS)则提供了美国地名数据,包含机场分类,与GNS互补形成全球机场数据集。

机场的影像数据来源于谷歌地球17级切片(分辨率约1.2米),切片以39*39的大小下载并拼接成完整的影像。此大小的影像经度跨度约为0.1度,从而避免因数据误差而导致机场未被影像涵盖的问题。

本实例对全球机场数据库的验证方法,主要包括以下步骤

步骤1、机场数据融合——融合OAC、GNO和GNS+GNIS三种全球机场位置数据集以获取更完整的数据集,数据集融合方法如下:

A1、数据集预处理,包括无效值去除、数据去重、数据结构的格式化。

A2、坐标匹配,坐标匹配将OAC数据集中的机场位置与其余数据集中的机场位置作差。若经度、纬度之间的差值均小于阈值(0.04度),则匹配成功。未能成功坐标匹配的数据,则根据其名称计算文本相似度。

A3、名称匹配,计算前,先去除机场名称中有关地名(如Shanghai)、机场类型(如Airport)等关键词,再对单词重新排序,最后计算新字符串的编辑距离。剩余未匹配的机场数据,将其添加至OAC数据集中,形成更完整的机场数据集。

本步骤中,数据集融合是以OAC数据集为基准,匹配GNO和GNS+GNIS这两组数据集。数据集预处理,包括无效值去除、数据去重、数据结构的格式化。预处理后的数据结构及注释如下所示:

坐标匹配是将OAC数据集中的机场位置与其余数据集中的机场位置作差。若经度、纬度之间的差值均小于阈值(0.04度),则匹配成功。未能成功坐标匹配的数据,则根据其名称计算文本相似度。名称匹配在计算前,先去除机场名称中有关地名(如Shanghai)、机场类型(如Airport)等关键词,再对单词重新排序,最后计算新字符串的编辑距离,使用莱温斯坦距离公式:

其中,lev

步骤2、深度学习模型训练——训练两种深度学习模型,第一种是基于YOLO-v3的跑道检测模型,用于检测图像中的跑道,第二种是基于ResNet-101的重分类模型,用于检测结果的重分类以提高精度,训练过程如下:

B1、样本标注,跑道探测属于目标框选的探测阶段,通常目标框选的样本使用正矩形进行标注。但机场跑道在遥感影像中多呈现为斜长条型,如果用正矩形进行标注,标注框内含有过多周边地物信息,不利于模型的训练。遥感影像中机场跑道大多为斜向,所以本发明选用多边形对随机选取的机场影像进行标注,可以有效减少数据增广后跑道样本内包含的周边地物信息量。

B2、数据增广,受限于标注机场跑道样本的数量,以及为了训练泛化能力更强的模型,需要进行样本数据增广。数据增广分为颜色操作、几何操作、标注框操作。对遥感影像来说,标注框所占的比例很小,所以本发明未采用标注框操作。

B3、基于YOLO-v3的跑道检测模型训练,YOLO-v3是目前最先进的目标探测器之一,在速度和精度上作了良好的平衡。再利用该模型对数据库部分点位的影像进行识别,产生含有正确或错误识别的初始结果框。

B4、基于ResNet-101的重分类模型训练,对初始结果框进行手动筛选和裁剪划分为正负样本,再通过样本增广之后对ResNet-101模型进行训练;

本步骤中,样本标注选用多边形对随机选取的300个机场影像进行标注,可以有效减少数据增广后跑道样本内包含的周边地物信息量,如图3(a)所示。数据增广使用了直方图均衡、明度、对比对、旋转、镜像、裁剪、平移增强增广方法,如下表所示:

经过数据增广后如图3(b)所示,38400个样本并基于YOLLO-v3的跑道检测模型训练,并以Adam算法作为训练的优化器,整个训练过程有100次,将前50次训练的学习率设置为0.001,此时darknet框架层处于冻结状态;将后50次训练的学习率设置为0.0001,此时将所有框架层开启。结果如图5(a)所示,loss值为5.2,准确率为92.8%召回率为85.1%。除此之外,还选取了30个机场作为跑道探测模型的测试数据,这30个机场同样被标注、数据增广,生成了3840个测试样本,从验证后的初步结果中我们选取1222个候选结果(正样本:811,负样本:411)作为基于ResNet-101的重分类模型训练的训练数据。这些数据进行了45度旋转、直方图均衡等增广操作,生成19552个样本(正样本:12976,负样本6576)如图3(c)(d)所示。训练共100次,使用Adam算法为模型优化器,学习率设置为0.0001。结果图5(b)所示,loss值为6.7,准确率为85.9%,两种模型训练实例如图3所示。对比单一的识别模型,本发明的优越性如下表:

步骤3、机场影像验证——将以上两个已训练的模型结合,验证融合数据集影像中所有机场的位置点,如果影像中存在一个或多个机场跑道,则该点位通过验证;反之,则该点位并不存在机场。验证分为三步如下所示:

C1、双尺度跑道探测,为适应不同的机场规模,基于已训练的YOLO-v3模型,使用双尺度跑道探测器。将两个探测器的结果作为候选框,进行非极大值约束(Non-MaximumSuppress ion,NMS),以获得探测器评分score

C2、初始结果再分类,通过跑道检测的验证结果仍存在少量非跑道目标(如河流、公路、条形云等),需使用已训练的ResNet-101再分类器判断跑道检测候选框中是否为机场跑道并定为潜在区。并计算分类器评分score

C3、筛选和评分,根据对机场的先验知识和置信度筛选潜在区,如果区域中检测到的跑道太小或太大或候选区中心坐标离待验证位置过远,则删除该区域。最后综合探测器和再分类器的置信度结果进行评分,评分公式如下:

其中,score

本步骤中,双尺度跑道探测,如图4(a)所示,第一个探测器以整幅影像尺度(37*37瓦片大小)探测大、中型机场跑道;第二个探测器以17*17瓦片大小的滑动窗口(步长为5)探测影像中的中、小型机场跑道。将两个探测器的结果作为候选框,进行非极大值约束(Non-Maximum Suppression,NMS),如图4(b)所示,NMS的步骤如下:(1)将候选框以置信度排序;(2)取出置信度最高的候选框;(3)计算它和其余候选框的IoU值;(4)删除IoU大于阈值0.5的候选框;(5)重复1-4步,直到候选框之间IoU均小于阈值,此时剩余的候选框即为潜在区。初始结果再分类,如图4(c)(d),需要用再分类器判断跑道检测候选框中是否为机场跑道并定为潜在区。评分和筛选综合探测器和再分类器的置信度结果进行评分,评分公式如下:

其中,score

选用全球46290个机场点的谷歌地球17级遥感影像,分辨率约为1.2米。整张影像由37*37瓦片组成,每个瓦片为256*256像素的图片,影像大小为9472*9472像素(约18MB)。所有验证共花费102.9小时,平均每幅图像8秒。根据经验设置0.65作为验证通过的阈值,如图6所示,共29259张影像通过验证。

验证实施例:

下面为验证本发明方法的精度及可靠性,继续以该实例进行说明。

本发明的可靠性验证,通过考虑机场规模及空间分布进行科学的采样分析,样本中的机场规模统计如下表所示,包括机场占瓦片的比值、机场数量、

样本总数为500,通过人工核实,281景影像中存在292个机场。本发明可以正确识别455景样本影像,正确率91.0%;存在机场的281景样本影像中,正确识别266景影像,正确率94.7%;不存在机场的219景影像中,正确判断198景影像,正确率86.3%。各大洲样本详细验证情况如下表所示:

虽然本发明存在结果错误及遗漏,但整体精度达到91.0%,验证全球数据集相比人工验证耗时1543小时,本发明仅需102.9小时。随着数据结构的不断变化和硬件设备的定期更新,这一差距将不断扩大。

除上述实施例外,本发明还可以有其他实施方式。凡采用等同替换或等效变换形成的技术方案,均落在本发明要求的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号