首页> 中国专利> 一种基于深度学习的地形数据库更新方法及系统

一种基于深度学习的地形数据库更新方法及系统

摘要

本发明提供一种基于深度学习的地形数据库更新方法及系统,属于地理信息数据更新技术领域,包括:获取样本数据集并分别训练三个神经网络,得到三个模型;基于地理文本关系抽取模型,根据目标网络数据确定目标地理实体及实体间的依存关系,并更新地形数据库中的目标地理实体要素得到第一增量图层;基于管线设施点检测模型,确定新时相影像中的管线设施点并更新管线设施要素得到第二增量图层;基于其他地形要素类语义分割模型,确定新时相影像中的地形要素并更新其他地形要素得到第三增量图层;根据三个增量图层形成新版地形数据库。将自然语言处理、目标检测及语义分割相结合,对不同类型的地形要素进行自动更新,提高了地形数据库的更新效率。

著录项

  • 公开/公告号CN114661744A

    专利类型发明专利

  • 公开/公告日2022-06-24

    原文格式PDF

  • 申请/专利权人 自然资源部第三地理信息制图院;

    申请/专利号CN202210566029.0

  • 申请日2022-05-24

  • 分类号G06F16/23;G06F16/29;G06F16/51;G06V20/10;G06V20/70;G06V10/82;G06N3/04;

  • 代理机构北京高沃律师事务所;

  • 代理人王爱涛

  • 地址 610100 四川省成都市龙泉驿区建设路2号附2号

  • 入库时间 2023-06-19 15:46:15

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-06-24

    公开

    发明专利申请公布

说明书

技术领域

本发明涉及地理信息数据更新领域,特别是涉及一种基于深度学习的地形数据库更新方法及系统。

背景技术

基础地理信息数据库是区域统一空间基准框架下反映地物要素分布的基础信息数据,是空间规划、国土整治、资源开发、环境保护、防灾减灾、突发应急和各项工程建设最基础的地理空间信息资料。随着经济社会的快速发展,作为基础地理信息数据库的重要组成部分——地形数据库,变化较快,尤其是道路、居民地、电力线等要素的变化更新较快,为了满足各种应用的数据现势性需求,亟需通过常态化更新不同比例尺地形数据库来保持数据的现势性和有效性,增强其应用价值。

目前,地形数据库更新主要采用基于航天遥感影像的数字摄影测量方式开展,在原有旧版矢量要素数据的基础上,基于最新数字正射影像图或按像对恢复的立体模型,参考地名、水利、电力、通信、交通等专业资料,对数据进行整合,采用人工室内解译结合野外调绘与核查的技术手段,实现地形数据库的更新,根据测区基础控制等资料的完整性情况,主要有“内-外-内”和“外-内-外-内”两种作业模式,其主要工艺流程包括现势资料收集、遥感影像内业预判更新、外业调绘核查更新、内业编辑整理建库等,整个数据更新过程人工工作量大,耗时长,效率低。

基于上述问题,亟需一种新的更新方法以提高地形数据库的更新效率。

发明内容

本发明的目的是提供一种基于深度学习的地形数据库更新方法及系统,可提高地形数据库的更新效率。

为实现上述目的,本发明提供了如下方案:

一种基于深度学习的地形数据库更新方法,包括:

获取地理文本语料数据集、管线设施点样本数据集及其他地形样本数据集;所述地理文本语料数据集中包括多个地理实体文本及各地理实体间的依存关系;所述管线设施点样本数据集中包括多张第一样本影像及各第一样本影像中样本管线设施点的外接矩形框和样本管线设施点类型;所述其他地形样本数据集中包括多张第二样本影像及各第二样本影像中地形要素的空间几何轮廓及地形要素类别;

根据所述地理文本语料数据集,对第一深度学习神经网络进行训练,得到地理文本关系抽取模型;

根据所述管线设施点样本数据集,对第二深度学习神经网络进行训练,得到管线设施点检测模型;

根据所述其他地形样本数据集,对第三深度学习神经网络进行训练,得到其他地形要素类语义分割模型;

获取存量地形数据库、目标网络数据、第一新时相影像及第二新时相影像;

基于所述地理文本关系抽取模型,根据所述目标网络数据,确定多个目标地理实体及各目标地理实体间的依存关系;

根据各目标地理实体及各目标地理实体间的依存关系,对存量地形数据库中的目标地理实体要素进行更新,得到第一增量图层;

基于所述管线设施点检测模型,根据所述第一新时相影像,确定所述第一新时相影像中各管线设施点的外接矩形框及管线设施点类型;

根据各管线设施点的外接矩形框及管线设施点类型,对存量地形数据库中的管线设施要素进行更新,得到第二增量图层;

基于所述其他地形要素类语义分割模型,根据所述第二新时相影像,确定所述第二新时相影像中各地形要素的空间几何轮廓及地形要素类别;

根据各地形要素的空间几何轮廓及地形要素类别,对存量地形数据库中的其他地形要素进行更新,得到第三增量图层;

根据所述第一增量图层、所述第二增量图层及所述第三增量图层,确定增量地形数据库,以形成新版地形数据库。

为实现上述目的,本发明还提供了如下方案:

一种基于深度学习的地形数据库更新系统,包括:

样本数据采集单元,用于获取地理文本语料数据集、管线设施点样本数据集及其他地形样本数据集;所述地理文本语料数据集中包括多个地理实体文本及各地理实体间的依存关系;所述管线设施点样本数据集中包括多张第一样本影像及各第一样本影像中样本管线设施点的外接矩形框和样本管线设施点类型;所述其他地形样本数据集中包括多张第二样本影像及各第二样本影像中地形要素的空间几何轮廓及地形要素类别;

第一训练单元,与所述样本数据采集单元连接,用于根据所述地理文本语料数据集,对第一深度学习神经网络进行训练,得到地理文本关系抽取模型;

第二训练单元,与所述样本数据采集单元连接,用于根据所述管线设施点样本数据集,对第二深度学习神经网络进行训练,得到管线设施点检测模型;

第三训练单元,与所述样本数据采集单元连接,用于根据所述其他地形样本数据集,对第三深度学习神经网络进行训练,得到其他地形要素类语义分割模型;

数据获取单元,用于获取存量地形数据库、目标网络数据、第一新时相影像及第二新时相影像;

目标地理实体确定单元,分别与所述第一训练单元及所述数据获取单元连接,用于基于所述地理文本关系抽取模型,根据所述目标网络数据,确定多个目标地理实体及各目标地理实体间的依存关系;

目标地理实体更新单元,分别与所述目标地理实体确定单元及所述数据获取单元连接,用于根据各目标地理实体及各目标地理实体间的依存关系,对存量地形数据库中的目标地理实体要素进行更新,得到第一增量图层;

管线设施确定单元,分别与所述第二训练单元及所述数据获取单元连接,用于基于所述管线设施点检测模型,根据所述第一新时相影像,确定所述第一新时相影像中各管线设施点的外接矩形框及管线设施点类型;

管线设施更新单元,分别与所述管线设施确定单元及所述数据获取单元连接,用于根据各管线设施点的外接矩形框及管线设施点类型,对存量地形数据库中的管线设施要素进行更新,得到第二增量图层;

其他地形确定单元,分别与所述第三训练单元及所述数据获取单元连接,用于基于所述其他地形要素类语义分割模型,根据所述第二新时相影像,确定所述第二新时相影像中各地形要素的空间几何轮廓及地形要素类别;

其他地形更新单元,分别与所述其他地形确定单元及所述数据获取单元连接,用于根据各地形要素的空间几何轮廓及地形要素类别,对存量地形数据库中的其他地形要素进行更新,得到第三增量图层;

新版地形数据库确定单元,分别与所述目标地理实体更新单元、所述管线设施更新单元及所述其他地形更新单元连接,用于根据所述第一增量图层、所述第二增量图层及所述第三增量图层,确定增量地形数据库,以形成新版地形数据库。

根据本发明提供的具体实施例,本发明公开了以下技术效果:根据地理文本语料数据集,对第一深度学习神经网络进行训练,得到地理文本关系抽取模型,基于地理文本关系抽取模型,对目标网络数据自然语言处理,确定目标地理实体的变化并对存量地形数据库中的目标地理实体要素进行更新;根据管线设施点样本数据集,对第二深度学习神经网络进行训练,得到管线设施点检测模型,基于管线设施点检测模型,对第一新时相影像中的管线设施点进行目标检测,并对存量地形数据库中的管线设施要素进行更新;根据其他地形样本数据集,对第三深度学习神经网络进行训练,得到其他地形要素类语义分割模型,基于其他地形要素类语义分割模型,对第二新时相影像进行语义分割,确定地形要素的空间几何轮廓及地形要素类别,并对存量地形数据库中的其他地形要素进行更新。通过将自然语言处理、深度学习目标检测及深度学习语义分割相结合,对不同类型的地形要素进行自动更新,提高了地形数据库的更新效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明基于深度学习的地形数据库更新方法的流程图;

图2为地形库更新过程示意图;

图3为本发明基于深度学习的地形数据库更新系统的结构示意图。

符号说明:

样本数据采集单元-1,第一训练单元-2,第二训练单元-3,第三训练单元-4,数据获取单元-5,目标地理实体确定单元-6,目标地理实体更新单元-7,管线设施确定单元-8,管线设施更新单元-9,其他地形确定单元-10,其他地形更新单元-11,新版地形数据库确定单元-12。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的目的是提供一种基于深度学习的地形数据库更新方法及系统,能够自动定位识别变化的地形要素,适配不同更新需求,更新效率高,且数据准确度高,以人机协同式作业实现地形数据库的智能化自动化更新,适合在地理信息数据更新技术领域广泛应用。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

如图1和图2所示,本发明基于深度学习的地形数据库更新方法包括:

S1:获取地理文本语料数据集、管线设施点样本数据集及其他地形样本数据集;所述地理文本语料数据集中包括多个地理实体文本及各地理实体间的依存关系;所述管线设施点样本数据集中包括多张第一样本影像及各第一样本影像中样本管线设施点的外接矩形框和样本管线设施点类型;所述其他地形样本数据集中包括多张第二样本影像及各第二样本影像中地形要素的空间几何轮廓及地形要素类别。具体地,根据不同地形要素的不同更新方式,采用人机交互的方式构建地形要素的样本数据库。样本数据库中包括地理文本语料数据集、管线设施点样本数据集及其他地形样本数据集。

S2:根据所述地理文本语料数据集,对第一深度学习神经网络进行训练,得到地理文本关系抽取模型。在本实施例中,第一深度学习神经网络为具备自然语言理解的神经网络,如ULMFiT、Transformer、BERT、GPT-2或BiLSTM等。

S3:根据所述管线设施点样本数据集,对第二深度学习神经网络进行训练,得到管线设施点检测模型。在本实施例中,第二深度学习神经网络为具备目标检测能力的卷积神经网络,如YOLO、Fast R-CNN等。

S4:根据所述其他地形样本数据集,对第三深度学习神经网络进行训练,得到其他地形要素类语义分割模型。在本实施例中,第三深度学习神经网络为具备语义分割的能力的神经网络,如U-Net、PSPNet、DeepLab等。

具体地,步骤S2、S3和S4中,分别将地理文本语料数据集、管线设施点样本数据集及其他地形样本数据集以7:2:1的比例分别分配为训练样本集、验证样本集和测试样本集。基于样本数据集类型的不同,选择不同的深度学习网络模型,设置迭代纪元、批量值和初始学习率等训练超参数。训练样本集直接用于模型训练,验证样本集用于动态调整模型的超参数,测试样本集用于检验模型的性能。

在本实施例中,定义一个迭代纪元表示所有训练样本集送入神经网络中完成一次前向计算及反向传播的过程。采用多GPU(graphics processing unit,图形处理器)数据并行的方式进行模型训练,监控训练中每个训练纪元的模型性能参数,当验证样本集的损失函数在连续的预设数量个迭代纪元中没有进一步下降时,自动终止模型训练进程,对训练完成的若干个迭代纪元模型进行精度评价。其中,地理文本关系抽取模型与管线设施点检测模型的评价指标采用准确率和召回率等常规的评价指标体系,其他地形要素类语义分割模型的性能评价指标为基于地物连通性图斑连通相似性指数。输出模型性能更优的地理文本关系抽取模型、管线设施点检测模型和其他地形要素类语义分割模型的。

S5:获取存量地形数据库、目标网络数据、第一新时相影像及第二新时相影像。具体地,存量地形数据库是指旧时相或者历史地形图上基础地理要素的矢量数据集。存量地形数据库中包括水系、居民地及设施、交通、管线、境界与政区、地貌与土质、植被和地名等9个要素类数据集,每个数据集存储相关地理要素的空间几何和属性字段。空间几何以点、线、面等不同方式表征要素的空间分布信息,属性字段以相关标准文件规定的定义要求记录要素的属性信息。属性字段内容设计参照基础地理信息地形要素数据规范。如水系面要素属性表字段包括国标分类码、水系名称代码、名称、水质、库容量、时令月份、类型、通行性质、现势性、更新状态标识、数据库标识和版本标识。第一新时相影像和第二新时相影像均为采集的待更新地区的新时相的卫星影像资料或者航空影像资料。

S6:基于所述地理文本关系抽取模型,根据所述目标网络数据,确定多个目标地理实体及各目标地理实体间的依存关系。在本实施例中,周期性遍历网络终端列表,访问更新周期内的目标网络数据,形成文本信息。将文本信息输入至地理文本关系抽取模型,识别出涵盖地理实体与依存关系的文本信息。

S7:根据各目标地理实体及各目标地理实体间的依存关系,对存量地形数据库中的目标地理实体要素进行更新,得到第一增量图层。

S8:基于所述管线设施点检测模型,根据所述第一新时相影像,确定所述第一新时相影像中各管线设施点的外接矩形框及管线设施点类型。

具体地,步骤S8处理管线的空间状态变化的地理事件。基于深度学习和第一新时相影像检测出电线塔和变电站管线设施点,聚焦变电站空间位置,顺序连接电线塔,完成电线走向的定位。首先对第一新时相影像进行匀光匀色处理,保持影像真实的色彩和亮度。再调整影像像素位深和波段顺序,使第一新时相影像的格式参数与第一样本影像的格式参数保持一致,得到第一预处理新时相影像。将第一预处理新时相影像输入至管线设施点检测模型进行预测,输出预测结果。其中预测结果包括管线设施点所在地理位置的外接矩形框和管线设施点类型。

S9:根据各管线设施点的外接矩形框及管线设施点类型,对存量地形数据库中的管线设施要素进行更新,得到第二增量图层。

S10:基于所述其他地形要素类语义分割模型,根据所述第二新时相影像,确定所述第二新时相影像中各地形要素的空间几何轮廓及地形要素类别。

具体地,对第二新时相影像进行匀光匀色处理,保持影像真实的色彩和亮度,调整影像像素位深和波段顺序,使第二新时相影像的格式参数与第二样本影像的格式参数保持一致,得到第二预处理新时相影像。将第二预处理新时相影像输入至其他地形要素类语义分割模型进行预测,输出预测概率图。遍历预测概率图,定义预测概率图中任意像元位置为(

S11:根据各地形要素的空间几何轮廓及地形要素类别,对存量地形数据库中的其他地形要素进行更新,得到第三增量图层。

S12:根据所述第一增量图层、所述第二增量图层及所述第三增量图层,确定增量地形数据库,以形成新版地形数据库。本实施中的更新主要围绕几何更新和属性更新两个方面,预测结果经过后处理都需要写入待更新数据库中以完成更新。具体地,整理第一增量图层、所述第二增量图层及所述第三增量图层,按照地形数据库的内容组织成增量地形数据库,根据专业现势资料和外业实地核查情况,并将外业实地调绘成果返回内业进行编辑处理,形成新版地形数据库。

本发明基于自然语言处理捕捉网络地理文本,分析与地名、境界及政区两类地形要素相关的地理变化行为;基于目标检测提取新时相影像的管线设施点,与存量地形数据分析提取管线设施的增量数据;基于语义分割提取新时相影像的其他地形要素类,与存量地形数据分析提取其他地形要素类的增量数据,能够自动定位识别变化的地形要素,适配不同更新需求,提高地形数据库的更新效率。

与传统工艺相比,大数据分析可以及时从公开的互联网资讯中挖掘地形要素变化更新的关键信息,可以极大提升变化发现的时效性;深度学习方法能够从影像数据中自动地学习到地物中表达能力较强的特征,具备一定程度的泛化能力。由此,利用深度学习更新地形数据库可以在一定程度上克服传统更新方法的不足,不再局限于基于影像的人机交互式目视判读变化提取更新作业模式,基于影像大数据和互联网大数据,泛在感知地形要素变化的地理事件,自动捕捉解析地理事件,映射到不同类别的地形数据,然后人机协同式完成地形数据库的更新,极大提高地形数据更新效率和更新质量,提升地形数据的应用价值,实现对泛在网络空间数据的高效抓取与解析、对遥感大数据的自动分析与挖掘,为大数据时代的地理信息数据更新提供新的途径。

进一步地,步骤S1具体包括:

S101:获取网络地理文本数据,并筛选出引起地理实体空间变化和语义变化的地理事件,得到非结构化文本列表集合。具体地,确定与地名、境界及政区相关的网络地理文本信息来源的网络终端列表(例如民政交通单位的网站、微博、公众号和社交媒体等信息发布平台)。遍历网络终端列表,访问网络数据,通过冗余数据删除和文本统一编码操作进行数据清洗,筛选出引起地理实体空间变化和语义变化的地理事件,形成非结构化文本列表集合。

S102:将所述非结构化文本列表集合中的文本分解为多个词语,得到词语集合。具体地,遍历非结构化文本列表集合,逐一将文本分解为以字词为单位的词语集合。

S103:遍历所述词语集合,对各词语的词性进行标注。在本实施例中,若词语归属于测绘领域常见的居民地及设施和境界与政区,则将对一个的词语标注为地理实体,用“ns”表示。

S104:根据各词语的词性,从所述词语集合中筛选出多个地理实体文本,并确定各地理实体间的相互依存关系。在词性标注完成后,筛选出词性为“ns”的词,分析词语与词语之间的相互依存关系,搜索与地理实体ns相关联的依存关系,并标注为依存关系“v”。保留地理实体ns与依存关系v,删除其它非目标词性的词语。最后基于词语集合中词语的前后顺序,重新组合成只包含地理实体与依存关系的结构化文本。

S105:获取多张第一样本影像,并对各第一样本影像中的管线设施点的类型进行标注,采用外接矩形框对各第一样本影像中的管线设施点的形状进行标注。

具体地,选择管线设施点数量多、种类多、空间位置分布不连续的影像作为第一样本影像。人工勾绘影像中每一个管线设施点的最小包络矩形,用于表征管线设施点的空间地理位置。标识管线设施点类型,形成与第一样本影像配套的管线矢量标注数据。管线矢量标注数据包括外接矩形框和设施点类型。其中,外接矩形框是空间几何元素,设施点类型是属性元素。

管线设施是相关标准文件中区分的大类,具体包含了电杆、电线架、地下通信线、架空的工业管道等多种设施,本发明主要针对地面上遥感影像可见的管线类型。

在本实施例中,对各第一样本影像进行匀光匀色、像素位深调整、波段重组和色彩空间变换处理,得到对应的预处理影像。将各预处理影像裁剪至统一尺寸,并进行标准化编号,得到对应的标准化影像。具体地,对裁剪后的预处理影像进行统一编号,赋予唯一标识。遍历标准化影像,若标准化影像中对应存在管线矢量标注数据,则提取最小外接矩形空间几何的中心点坐标、矩形的长度、矩形的宽度、属性信息及管线设施点类型,形成以标准化编号命名的可扩展标记语言文件。若影像中不存在管线矢量标注数据,则新建一个内容为空的可扩展标记语言文件。然后依据目标检测标准数据集格式整理输出初始管线设施点样本数据集。管线矢量标注数据对应的可扩展标记语言与标准化编号保持一致。

进一步地,随机选择初始管线设施点样本数据集中的样本影像进行多个维度的数据增强,模拟出更加丰富的样本数据资源,形成管线设施点样本数据集。其中数据增强包括色彩扰动(LAB颜色空间、HSV色彩空间)、几何变形(缩放、旋转)、空间变换(镜像、移位)和图像滤镜(噪声、模糊)。

S106:获取多张第二样本影像,并对各第二样本影像中的地形要素类的空间几何轮廓及类别进行标注。

在本实施例中,其他地形要素类包括水系、交通、植被、居民地及设施、地貌与土质等地形要素类。首先选择不同地理环境下的其他地形要素类数量多、纹理特征丰富的影像作为第二样本影像。人工勾绘第二样本影像上地形要素类的空间几何轮廓,标识地形要素的类别,形成与第二样本影像配套的其他地形要素类矢量标注数据。

对第二样本影像进行预处理,预处理方式与第一样本影像的预处理方式相同,在此不再赘述。对其他地形要素类矢量标注数据进行栅格化处理,形成标记影像,并将第二样本影像和标记影像裁剪至统一尺寸,进行标准化编号,得到初始其他地形样本数据集。对初始其他地形样本数据集中的样本影像进行多个维度的数据增强,模拟出更加丰富的样本数据资源,形成其他地形样本数据集。其中数据增强方式与初始管线设施点样本数据集的数据增强方式一致,在此不再赘述。

进一步地,所述存量地形数据库中包括地名要素类及境界与政区要素类;所述地名要素类及所述境界与政区要素类中均包括多个地理实体要素。

步骤S7包括:

S701:采用逆地理编码服务引擎对各目标地理实体进行空间定位,并将各目标地理实体映射至所述地名要素类和所述境界与政区要素类中,确定与各目标地理实体对应的地理实体要素。

S702:基于各目标地理实体间的依存关系,确定各目标地理实体的更新类型;所述更新类型为消失、出现或修改。

S703:针对任一目标地理实体,若更新类型为消失,则将所述地名要素类及境界与政区要素类中对应的地理实体要素的记录删除。

S704:若更新类型为出现,则根据所述目标地理实体及各目标地理实体间的依存关系,在所述地名要素类及境界与政区要素类中新增一条地理实体要素的记录,并确定所述地理实体要素的空间几何,添加属性信息。

S705:若更新类型为修改,则根据所述目标地理实体及各目标地理实体间依存关系,修改所述地名要素类及境界与政区要素类中对应的地理实体要素的空间几何或属性信息。

S706:根据修改后的地名要素类及境界与政区要素类,确定第一增量图层。此外,还可以根据专业现势资料进一步补充完善核查,提取发生变化的地名要素和境界与政区要素,并输出地名和境界及政区的增量图层。

更进一步地,所述管线设施要素包括管线设施点要素及管线设施线要素。所述第二增量图层包括管线设施点增量图层及管线设施线增量图层。所述存量地形数据库中包括管线设施点要素类及管线设施线要素类。所述管线设施点要素类中包括多个管线设施点要素。所述管线设施线要素类中包括多个管线设施线要素。

步骤S9包括:

S901:提取各管线设施点的外接矩形框的几何中心位置,并根据各管线设施点的几何中心位置及管线设施点类型,确定各管线设施点的预测矢量数据。具体地,将几何中心位置写入管线设施点图层的空间信息,将管线设施点类型写入其属性信息表,得到管线设施点的预测矢量数据。

S902:根据各管线设施点的预测矢量数据,对所述管线设施点要素类中对应的管线设施点要素进行更新,确定管线设施点增量图层。

具体地,步骤902包括:

对各管线设施点的预测矢量数据与所述管线设施点要素类中对应的管线设施点要素进行缓冲分析,确定各预测矢量数据的更新类型。所述更新类型为出现、消失或修改。

具体地,预测矢量数据与管线设施点要素类中对应的管线设施点要素以不同比例尺精度为缓冲半径进行缓冲分析,以判断预测矢量数据的变化逻辑。例如以1:10000地形图更新为例,则采用以下公式计算缓冲半径:

其中,0.1

若预测矢量数据的管线设施点与存量地形数据库中数据类型一致,空间位置在几何容差范围内,则视为未发生变化,否则,视为发生变化,进一步确定预测矢量数据的更新类型。

针对任一预测矢量数据,若更新类型为出现,则根据所述预测矢量数据,在所述管线设施点要素类中新增一条管线设施点要素的数据记录。

若更新类型为消失,则将所述管线设施点要素类中对应的管线设施点要素的记录逻辑删除。

若更新类型为修改,则根据所述预测矢量数据,修改所述管线设施点要素类中对应的管线设施点要素的数据记录。

根据修改后的管线设施点要素类,确定管线设施点增量图层。

S903:遍历管线设施点增量图层,按照邻近关系,将各管线设施点顺序连接,得到多个新线状要素。

S904:根据各新线状要素,对所述管线设施线要素类中对应的管线设施线要素进行更新,确定管线设施线增量图层。

具体地,步骤S904包括:针对任一新线状要素,对所述新线状要素与所述管线设施线要素类中对应的管线设施线要素进行几何相似性分析,确定所述新线状要素的更新类型。所述更新类型为出现、消失及修改。

其中,新线状要素与管线设施线要素的几何相似性分析采用相邻节点间平均欧式距离来衡量,设置阈值来判断变化情况。若新线状要素与管线设施线要素之间的平均欧式距离大于阈值,则视为发生变化,小于阈值,则视为无变化。

例如新线状要素

其中,

若更新类型为出现,则根据所述新线状要素,在所述管线设施线要素类中新增一条管线设施线要素的数据记录。

若更新类型为消失,则将所述管线设施线要素类中对应的管线设施线要素的记录逻辑删除。

若变化情况为修改,则根据所述新线状要素,修改所述管线设施线要素类中对应的管线设施线要素的数据记录。

根据修改后的管线设施线要素类,确定管线设施线增量图层。

更进一步地,所述存量地形数据库中包括其他地形要素类。所述其他地形要素类中包括多个其他地形要素。

步骤S11具体包括:

S1101:根据各地形要素的空间几何轮廓,确定各地形要素的面状矢量数据。具体地,遍历全色栅格影像,查找聚集成片的非零像素图斑,并检索其所有轮廓信息,根据嵌套轮廓的层次信息,重构为空间几何,字段记录像素值,得到面状矢量数据。按照地形图更新要求对面状矢量数据进行面积过滤、节点抽稀和边缘光滑等后处理工序,检查空间拓扑关系,根据记录的像素值,对应分别输出各地形要素的面状矢量数据。

S1102:根据空间几何的相关性,建立各面状矢量数据与所述其他地形要素类中的其他地形要素的对应关系,并对比各面状矢量数据和对应的其他地形要素,确定各面状矢量数据的更新类型;所述更新类型为出现、消失或修改。

S1103:针对任一面状矢量数据,若更新类型为出现,则根据所述面状矢量数据,在其他地形要素类中新增一条其他地形要素的数据记录。

S1104:若更新类型为消失,则将所述其他地形要素类中对应的其他地形要素的记录逻辑删除。

S1105:若更新类型为修改,则根据所述面状矢量数据,修改所述其他地形要素类中对应的其他地形要素的数据记录。此外,还可以根据专业现势资料进一步补充完善核查。

S1106:根据修改后的其他地形要素类,确定第三增量图层。

本发明基于数字摄影测量学、航空摄影测量学基本原理,利用大数据时代背景下深度学习语义分割、目标检测、自然语言处理的技术方法,对数字影像中特征明显的水系、交通、植被、居民地及设施、境界与政区、管线、地貌与土质、地名等核心矢量要素,实现计算机自动化的特征分类提取、变化定位发现、变化匹配更新,从而达到了智能、动态、快速更新地形数据库核心矢量要素的目的。

为了更好的理解本发明的方案,下面结合具体实施例进一步进行说明。

实施例1:电力线要素更新

本实施例以地形数据库中电力线要素的更新为例,来说明本发明地形数据库更新方法和技术效果。

(1)首先获取待更新区域的存量地形数据库和新时相的卫星影像资料或者航空影像资料。

(2)将新时相的影像资料输入管线设施点检测模型,输出决定电力线走向的电力塔的目标检测结果,目标检测结果由矩形方框圈定,并标识出每个目标检测结果的置信度,置信度越大说明模型对输出的结果越肯定。

(3)将目标检测结果从像素坐标系投影映射至真实的空间坐标系下,目标检测结果的矩形方框转变为矢量面几何要素。在本实施例中,矢量面几何要素为电力塔几何面要素。

(4)计算每个电力塔几何面要素中心点,并将其按照空间临近关系构成几何线要素,该几何线即为电力线。将该几何线要素与存量数据库中的几何线要素进行空间匹配,建立新要素与存量要素的空间对应关系,最后分析新要素与存量要素几何特征的变化情况。

(5)如果未发生变化则不更新,如果发生变化则将新电力线替换至地形数据库中,自动完成更新工作。

实施例2:地名、政区与境界更新

本实施例具体描述本发明利用网络大数据动态实时更新地名的应用过程。

(1)建立网络地理文本样本语料库

建立与地名相关的网络地理文本信息来源的网络终端知识库。如成都市民政局官网民生咨询栏目

获取与地名变化有关的信息条目,通过分词、词性标注、分析文本词语间的相互依存关系,构建(地理实体,关系,地理实体)三元组形式表达的结构化文本,输出样本5000个,最终以预设7:2:1比例自动分配样本数据份额,输出3500个训练样本、1000个验证样本和500个测试样本。

(2)模型训练

将(1)中的样本语料库输入至深度学习神经网络进行训练,得到地理文本关系抽取模型。具体地,选择具备自然语言理解的神经网络ULMFiT、Transformer、BERT、GPT-2或BiLSTM等,本实施例的参数设置如表1所示,自动进行训练。

表1 模型训练参数设置

根据训练结果的指标(精度和召回率等)进行评价,选择适配于实际地名变化获取的最优模型。

(3)首先从网络知识库获取待更新区域的更新周期范围内的信息条目和存量地形数据库。

(4)将信息条目输入地理文本关系抽取模型进行运算,输出信息条目的变化信息。语义分析示意如表2所示。

表2 语义分析示意

(5)根据(4)中输出的信息“玉林街道办事处”和“跳伞塔街道办事处”搜索定位存量地形数据库的行政境界面要素类对应的要素,编辑属性表状态字段为消失,新增一个面要素,几何体为消失两个要素的几何,编辑属性字段,名称填写“玉林街道办事处”,状态字段填写“出现”。

(6)将(4)中输出的信息“玉林五巷3号”通过逆地理编码得到空间地理坐标(

(7)遍历(4)中的所有输出信息,自动完成地名、政区与境界的更新工作。

本发明采用自然语言处理和计算机视觉进行地形要素的变化发现和自动解译,相对于现有数字化测绘的人机交互式作业,实现智能化测绘的人机协同式作业,自动定位识别变化地形要素,变化发现的查全率在90%以上,工作效率提高20%。测绘生产、服务与应用面临着数据保障的实时化、信息处理的自动化和服务应用的知识化等一系列重大技术瓶颈。

此外,本发明基于深度学习的地形数据库更新方法同样适用于与地形数据库具备相似特征的其他基础地理信息数据库的更新工作。

如图3所示,本发明基于深度学习的地形数据库更新系统包括:样本数据采集单元1、第一训练单元2、第二训练单元3、第三训练单元4、数据获取单元5、目标地理实体确定单元6、目标地理实体更新单元7、管线设施确定单元8、管线设施更新单元9、其他地形确定单元10、其他地形更新单元11及新版地形数据库确定单元12。

其中,所述样本数据采集单元1用于获取地理文本语料数据集、管线设施点样本数据集及其他地形样本数据集。所述地理文本语料数据集中包括多个地理实体文本及各地理实体间的依存关系。所述管线设施点样本数据集中包括多张第一样本影像及各第一样本影像中样本管线设施点的外接矩形框和样本管线设施点类型。所述其他地形样本数据集中包括多张第二样本影像及各第二样本影像中地形要素的空间几何轮廓及地形要素类别。

所述第一训练单元2与所述样本数据采集单元1连接,所述第一训练单元2用于根据所述地理文本语料数据集,对第一深度学习神经网络进行训练,得到地理文本关系抽取模型。

所述第二训练单元3与所述样本数据采集单元1连接,所述第二训练单元3用于根据所述管线设施点样本数据集,对第二深度学习神经网络进行训练,得到管线设施点检测模型。

所述第三训练单元4与所述样本数据采集单元1连接,所述第三训练单元4用于根据所述其他地形样本数据集,对第三深度学习神经网络进行训练,得到其他地形要素类语义分割模型。

所述数据获取单元5用于获取存量地形数据库、目标网络数据、第一新时相影像及第二新时相影像。

所述目标地理实体确定单元6分别与所述第一训练单元2及所述数据获取单元5连接,所述目标地理实体确定单元6用于基于所述地理文本关系抽取模型,根据所述目标网络数据,确定多个目标地理实体及各目标地理实体间的依存关系。

所述目标地理实体更新单元7分别与所述目标地理实体确定单元6及所述数据获取单元5连接,所述目标地理实体更新单元7用于根据各目标地理实体及各目标地理实体间的依存关系,对存量地形数据库中的目标地理实体要素进行更新,得到第一增量图层。

所述管线设施确定单元8分别与所述第二训练单元3及所述数据获取单元5连接,所述管线设施确定单元8用于基于所述管线设施点检测模型,根据所述第一新时相影像,确定所述第一新时相影像中各管线设施点的外接矩形框及管线设施点类型。

所述管线设施更新单元9分别与所述管线设施确定单元8及所述数据获取单元5连接,所述管线设施更新单元9用于根据各管线设施点的外接矩形框及管线设施点类型,对存量地形数据库中的管线设施要素进行更新,得到第二增量图层。

所述其他地形确定单元10分别与所述第三训练单元4及所述数据获取单元5连接,所述其他地形确定单元10用于基于所述其他地形要素类语义分割模型,根据所述第二新时相影像,确定所述第二新时相影像中各地形要素的空间几何轮廓及地形要素类别。

所述其他地形更新单元11分别与所述其他地形确定单元10及所述数据获取单元5连接,所述其他地形更新单元11用于根据各地形要素的空间几何轮廓及地形要素类别,对存量地形数据库中的其他地形要素进行更新,得到第三增量图层。

所述新版地形数据库确定单元12分别与所述目标地理实体更新单元7、所述管线设施更新单元9及所述其他地形更新单元11连接,所述新版地形数据库确定单元12用于根据所述第一增量图层、所述第二增量图层及所述第三增量图层,确定增量地形数据库,以形成新版地形数据库。

进一步地,所述样本数据采集单元1包括:网络数据获取模块、词语分解模块、词性标注模块、实体确定模块、管线设施标注模块及地形要素标注模块。

其中,所述网络数据获取模块用于获取网络地理文本数据,并筛选出引起地理实体空间变化和语义变化的地理事件,得到非结构化文本列表集合。

所述词语分解模块与所述网络数据获取模块连接,所述词语分解模块用于将所述非结构化文本列表集合中的文本分解为多个词语,得到词语集合。

所述词性标注模块与所述词语分解模块连接,所述词性标注模块用于遍历所述词语集合,对各词语的词性进行标注。

所述实体确定模块与所述词性标注模块连接,所述实体确定模块用于根据各词语的词性,从所述词语集合中筛选出多个地理实体文本,并确定地理实体间的相互依存关系。

所述管线设施标注模块用于获取多张第一样本影像,并对各第一样本影像中的管线设施点的类型进行标注,采用外接矩形框对各第一样本影像中的管线设施点的形状进行标注。

所述地形要素标注模块用于获取多张第二样本影像,并对各第二样本影像中的地形要素类的空间几何轮廓及类别进行标注。

更进一步地,所述存量地形数据库中包括地名要素类及境界与政区要素类;所述地名要素类及所述境界与政区要素类中均包括多个地理实体要素。

所述目标地理实体更新单元7包括:映射模块、第一更新类型确定模块、第一删除模块、第一新增模块、第一修改模块及第一图层确定模块。

其中,所述映射模块分别与所述目标地理实体确定单元6及所述数据获取单元5连接,所述映射模块用于采用逆地理编码服务引擎对各目标地理实体进行空间定位,并将各目标地理实体映射至所述地名要素类和所述境界与政区要素类中,确定与各目标地理实体对应的地理实体要素。

所述第一更新类型确定模块与所述映射模块连接,所述第一更新类型确定模块用于基于各目标地理实体间的依存关系,确定各目标地理实体的更新类型。所述更新类型为消失、出现或修改。

所述第一删除模块分别与所述第一更新类型确定模块及所述数据获取单元5连接,所述第一删除模块用于针对任一目标地理实体,在更新类型为消失时,将所述地名要素类及境界与政区要素类中对应的地理实体要素的记录删除。

所述第一新增模块分别与所述第一更新类型确定模块及所述数据获取单元5连接,所述第一新增模块用于在更新类型为出现时,根据所述目标地理实体及各目标地理实体间的依存关系,在所述地名要素类及境界与政区要素类中新增一条地理实体要素的记录,并确定所述地理实体要素的空间几何,添加属性信息。

所述第一修改模块分别与所述第一更新类型确定模块及所述数据获取单元5连接,所述第一修改模块用于在更新类型为修改时,根据所述目标地理实体及各目标地理实体间依存关系,修改所述地名要素类及境界与政区要素类中对应的地理实体要素的空间几何或属性信息。

所述第一图层确定模块分别与所述第一删除模块、所述第一新增模块及所述第一修改模块连接,所述第一图层确定模块用于根据修改后的地名要素类及境界与政区要素类,确定第一增量图层。

进一步地,所述管线设施要素包括管线设施点要素及管线设施线要素;所述第二增量图层包括管线设施点增量图层及管线设施线增量图层;所述存量地形数据库中包括管线设施点要素类及管线设施线要素类;所述管线设施点要素类中包括多个管线设施点要素;所述管线设施线要素类中包括多个管线设施线要素。

所述管线设施更新单元9包括:管线提取模块、管线更新模块、连接模块及设施线更新模块。

其中,管线提取模块与管线设施确定单元8连接,管线提取模块用于提取各管线设施点的外接矩形框的几何中心位置,并根据各管线设施点的几何中心位置及管线设施点类型,确定各管线设施点的预测矢量数据。

设施点更新模块分别与管线提取模块及数据获取单元5连接,设施点更新模块用于根据各管线设施点的预测矢量数据,对管线设施点要素类中对应的管线设施点要素进行更新,确定管线设施点增量图层。

连接模块与设施点更新模块连接,连接模块用于遍历管线设施点增量图层,按照邻近关系,将各管线设施点顺序连接,得到多个新线状要素。

设施线更新模块分别与连接模块及数据获取单元5连接,设施线更新模块用于根据各新线状要素,对管线设施线要素类中对应的管线设施线要素进行更新,确定管线设施线增量图层。

具体地,所述设施点更新模块包括:第一更新类型确定子模块、第一新增子模块、第一删除子模块、第一修改子模块及设施点图层确定子模块。

其中,第一更新类型确定子模块分别与管线提取模块及数据获取单元5连接,第一更新类型确定子模块用于对各管线设施点的预测矢量数据与管线设施点要素类中对应的管线设施点要素进行缓冲分析,确定各预测矢量数据的更新类型。所述更新类型为出现、消失或修改。

第一新增子模块与第一更新类型确定子模块及数据获取单元5连接,第一新增子模块用于针对任一预测矢量数据,在更新类型为出现时,根据预测矢量数据,在管线设施点要素类中新增一条管线设施点要素的数据记录。

第一删除子模块与更新类型确定子模块及数据获取单元5连接,第一删除子模块用于在更新类型为消失时,将管线设施点要素类中对应的管线设施点要素的记录逻辑删除。

第一修改子模块与更新类型确定子模块及数据获取单元5连接,第一修改子模块用于在更新类型为修改时,根据预测矢量数据,修改管线设施点要素类中对应的管线设施点要素的数据记录。

设施点图层确定子模块分别与第一新增子模块、第一删除子模块及第一修改子模块连接,设施点图层确定子模块用于根据修改后的管线设施点要素类,确定管线设施点增量图层。

具体地,所述设施线更新模块包括:第二更新类型确定子模块、第二新增子模块、第二删除子模块、第二修改子模块及设施线图层确定子模块。

第二更新类型确定子模块分别与连接模块及数据获取单元5连接,第二更新类型确定子模块用于针对任一新线状要素,对新线状要素与管线设施线要素类中对应的管线设施线要素进行几何相似性分析,确定新线状要素的更新类型。更新类型为出现、消失及修改。

第二新增子模块与第二更新类型确定子模块及数据获取单元5连接,第二新增子模块用于在更新类型为出现时,根据新线状要素,在管线设施线要素类中新增一条管线设施线要素的数据记录。

第二删除子模块与第二更新类型确定子模块及数据获取单元5连接,第二删除子模块用于在更新类型为消失时,将管线设施线要素类中对应的管线设施线要素的记录逻辑删除。

第二修改子模块与第二更新类型确定子模块及数据获取单元5连接,第二修改子模块用于在变化情况为修改时,根据新线状要素,修改管线设施线要素类中对应的管线设施线要素的数据记录。

设施线图层确定子模块分别与第二新增子模块、第二删除子模块及第二修改子模块连接,设施线图层确定子模块用于根据修改后的管线设施线要素类,确定管线设施线增量图层。

更进一步地,所述存量地形数据库中包括其他地形要素类;所述其他地形要素类中包括多个其他地形要素。

所述其他地形更新单元11包括:面状矢量确定模块、第二更新类型确定模块、第二更新模块、第二删除模块、第二修改模块及第三图层确定模块。

其中,面状矢量确定模块与其他地形确定单元10连接,面状矢量确定模块用于根据各地形要素的空间几何轮廓,确定各地形要素的面状矢量数据。

第二更新类型确定模块与面状矢量确定模块及数据获取单元5连接,第二更新类型确定模块用于根据空间几何的相关性,建立各面状矢量数据与其他地形要素类中的其他地形要素的对应关系,并对比各面状矢量数据和对应的其他地形要素,确定各面状矢量数据的更新类型;更新类型为出现、消失或修改。

第二更新模块与第二更新类型确定模块及数据获取单元5连接,第二更新模块用于针对任一面状矢量数据,在更新类型为出现时,根据面状矢量数据,在其他地形要素类中新增一条其他地形要素的数据记录。

第二删除模块与第二更新类型确定模块及数据获取单元5连接,第二删除模块用于在更新类型为消失时,将其他地形要素类中对应的其他地形要素的记录逻辑删除。

第二修改模块与第二更新类型确定模块及数据获取单元5连接,第二修改模块用于在更新类型为修改时,根据面状矢量数据,修改其他地形要素类中对应的其他地形要素的数据记录。

第三增量图层确定模块用于根据修改后的其他地形要素类,确定第三增量图层。

根据本发明提供的具体实施例,本发明公开了以下技术效果:

(1)本发明实现地形要素变化发现的跨界融合与泛在感知。相较于传统变化发现依赖于多时相影像的分屏对比或者新时相影像逐一过屏与旧时相矢量数据对比,基于深度学习的变化感知对象不仅来源于影像,也来源于大数据时代下的网络地理信息文本,能够在不同领域完成不同维度地感知、挖掘和分析空间地理信息的变化。

(2)本发明实现地形要素变化提取的智能自主和精准服务。相较于传统变化提取工序是人机交互式手动勾绘变化区域的范围,基于深度学习的变化提取借助于预训练模型实施变化感知、采集、处理、分析与表达等行为,产出预更新数据成果。预更新模型的构建以知识为引导,以算法为基础,知识的构建可以适配不同更新需求,更新区域与更新周期可以调控,具备自主服务与精准服务能力。

(3)本发明实现地形数据库更新工艺的有效优化,提升测绘数据更新的科学性和时效性。深度学习应用于地形数据库更新将传统预更新作业模式“基于影像的人机交互变化提取”发展成“泛在感知的人机协作变化提取”的作业模式,有效地丰富了地形要素类变化感知的多源渠道。人机协作的创造性新工艺技术体系极大缩短了地形数据库更新的生产周期。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号