首页> 中国专利> 一种基于深度学习的城中村风险评估和风险因素定位方法

一种基于深度学习的城中村风险评估和风险因素定位方法

摘要

本发明提供一种基于深度学习的城中村风险评估和风险因素定位方法,利用群智感知技术搜索各类风险事故,对每类风险事故进行聚类,将超过阈值的作为风险热点,并根据城中村风险热点获取风险热点情景数据,所述风险热点情景数据包括城中村层面情景数据和场景层面情景数据;从城中村层面情景数据中提取城中村层面情景特征,从场景层面情景数据中提取场景层面情景特征;将城中村层面情景特征和场景层面情景特征输入构建的训练好的残差网络模型,评估城中村风险,并采用逐层相关传播算法定位风险因素;实现异构数据融合,具有高效、低耗的优点,同时也达到了较高的准确率。

著录项

  • 公开/公告号CN114925994A

    专利类型发明专利

  • 公开/公告日2022-08-19

    原文格式PDF

  • 申请/专利权人 厦门大学;

    申请/专利号CN202210493040.9

  • 申请日2022-05-07

  • 分类号G06Q10/06(2012.01);G06Q50/26(2012.01);G06N3/08(2006.01);G06N3/04(2006.01);G06K9/62(2022.01);

  • 代理机构厦门市首创君合专利事务所有限公司 35204;

  • 代理人连耀忠

  • 地址 361000 福建省厦门市思明南路422号

  • 入库时间 2023-06-19 16:26:56

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-09-06

    实质审查的生效 IPC(主分类):G06Q10/06 专利申请号:2022104930409 申请日:20220507

    实质审查的生效

说明书

技术领域

本发明涉及人工智能、大数据、城市计算领域,特别是指一种基于深度学习的城中村风险评估和风险因素定位方法。

背景技术

城中村是指位于发展中国家发达城市中的落后村庄。一般来说,城中村的特点往往是建筑过于拥挤、人口密度高、基础设施陈旧、公共安全差,这往往会导致潜在的安全风险,如火灾、交通事故和流行病。此类安全事件通常会造成巨大的生命和财产损失。随后,降低这些风险已成为城市当局的主要任务之一。

传统上,诊断城中村的安全风险通常依赖于现场调查,研究人员需要收集城中村发生的事件,并在城中村进行专家现场调查,得出相关结论,这既费时又费力。近年来,数据驱动方法已被用于调查和分析城中村的安全事件。然而,现有方法高度依赖专家提供的昂贵领域知识,使得分析难以扩展到异构的城市大数据,因此无法对城中村的各种安全风险进行系统诊断。

发明内容

本发明的主要目的在于克服现有技术中的上述缺陷,提出一种基于深度学习的城中村风险评估和风险因素定位方法,采用异构数据融合的城中村风险评估方法和基于深度学习可解释性技术对城中村潜在风险因素进行推断的方法,具有高效、低耗的优点,同时也达到了较高的估计准确率。

本发明采用如下技术方案:

一种基于深度学习的城中村风险评估和风险因素定位方法,其特征在于,包括如下步骤:

利用群智感知技术搜索各类风险事故,对每类风险事故进行聚类,将超过阈值的作为风险热点,并根据城中村风险热点获取风险热点情景数据,所述风险热点情景数据包括城中村层面情景数据和场景层面情景数据;

从城中村层面情景数据中提取城中村层面情景特征,从场景层面情景数据中提取场景层面情景特征;

将城中村层面情景特征和场景层面情景特征输入构建的训练好的残差网络模型,评估城中村风险,并采用逐层相关传播算法定位风险因素。

具体地,所述利用群智感知技术搜索各类风险事故,对每类风险事故进行聚类,将超过阈值的作为风险热点,具体为:

利用群智感知技术搜索各类风险事故,包括但不限于风险事故发生时间、发生地点、经纬度、事故类型信息;

对每类风险事故进行聚类,先从空间上对风险事故聚类,再从时间上对风险事故聚类,得到聚类结果,将超过阈值的记录作为风险热点。

具体地,并根据城中村风险热点获取风险热点情景数据,所述风险热点情景数据包括城中村层面情景数据和场景层面情景数据,具体为:

根据城中村风险热点搜索情景数据,所述风险热点情景数据包括城中村层面情景数据和场景层面情景数据;

对于城中村层面情景数据,收集风险热点的人口密度图、风险热点的卫星遥感图像;

对于场景级别情景数据,收集风险热点内部的场景信息,包括但不限于场景经纬度、街景信息、类型信息。

具体地,从城中村层面情景数据中提取城中村层面情景特征,具体为:

根据城中村风险热点的经纬度和人口密度图的网格数据,得到每个城中村风险热点的人口数;

根据城中村风险热点的遥感图像,统计遥感图像像素点的数量,利用像素点大小以及数量计算当前热点的面积;

收集非热点城中村的遥感图像,标记每张卫星遥感图像中的各类建筑物目标作为训练集;利用该训练集训练一个Mask R-CNN模型至收敛;根据城中村风险热点的遥感图像,利用Mask R-CNN模型统计不同类型房屋的数量;

根据城中村风险热点的边界信息,统计风险热点内部的城中村层面关注点的数量,所述关注点包括但不限于商店、旅游景点、公司、生活服务、餐厅、自助服务、娱乐设施、医院、旅馆;

将上述人口数、面积、不同类型房屋的数量以及关注点的数量拼接在一起,得到当前风险热点的城中村层面情景特征。

具体地,从场景层面情景数据中提取场景层面情景特征,具体为:

根据城中村风险热点的边界信息,搜索城中村风险热点内部的场景,得到场景信息列表;

根据场景信息列表,获取包括但不限于场景的经纬度、类型、街景图数据信息;

获取非热点城中村内部的街景图,标记每张图片中的目标,所述目标包括但不限于煤气罐、广告牌、缠绕电线、电动车、移动板房、变压器以及木材堆,并将图片中的目标作为训练集,训练YoloV3模型至收敛;利用YoloV3模型提取城中村风险热点每个场景对应街景图的各目标数量以及最高置信度作为每个场景的特征;

根据每个城中村风险热点中场景的经纬度,计算每个热点中场景间距离大小;

以场景为结点,场景间的地理距离作为边的权重,建立每个城中村风险热点的图;

利用图形卷积网络GCN实现图嵌入,将对应边的特征融入相应结点中,得到场景层面情景特征。

具体地,还包括训练残差网络模型,具体为:

根据提取每个城中村风险热点的城中村层面情景特征和场景层面情景特征,构建训练集正样本;

根据提取每个非城中村风险热点的城中村层面情景特征和场景层面情景特征,构建训练集负样本;

构建残差网络模型,在训练集上进行训练至收敛,得到训练好的残差网络模型;

在训练好的残差网络模型上,将每个城中村风险热点的城中村层面情景特征和场景层面情景特征作为输入,分析城中村风险热点的风险。

具体地,所述采用逐层相关传播算法定位风险因素,具体为:

将城中村风险热点的风险结果输入逐层相关传播算法模块;

逐层相关传播算法模块输出城中村层面情景特征和场景层面情景特征的每个特征位置具体贡献度数值,并按特征贡献度排序;

输出设定排名的特征位置及名称。

本发明另一方面提供一种基于深度学习的城中村风险评估和风险因素定位系统,包括:

风险热点情景数据获取单元:利用群智感知技术搜索各类风险事故,对每类风险事故进行聚类,将超过阈值的作为风险热点,并根据城中村风险热点获取风险热点情景数据,所述风险热点情景数据包括城中村层面情景数据和场景层面情景数据;

情景特征获取单元:从城中村层面情景数据中提取城中村层面情景特征,从场景层面情景数据中提取场景层面情景特征;

风险评估和风险因素定位单元:将城中村层面情景特征和场景层面情景特征输入构建的训练好的残差网络模型,评估城中村风险,并采用逐层相关传播算法定位风险因素。

本发明实施例再一方面提供一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于执行上述一种基于深度学习的城中村风险评估和风险因素定位方法。

由上述对本发明的描述可知,与现有技术相比,本发明具有如下有益效果:

(1)本发明提供一种基于深度学习的城中村风险评估和风险因素定位方法,利用群智感知技术搜索各类风险事故,对每类风险事故进行聚类,将超过阈值的作为风险热点,并根据城中村风险热点获取风险热点情景数据,所述风险热点情景数据包括城中村层面情景数据和场景层面情景数据;从城中村层面情景数据中提取城中村层面情景特征,从场景层面情景数据中提取场景层面情景特征;将城中村层面情景特征和场景层面情景特征输入构建的训练好的残差网络模型,评估城中村风险,并采用逐层相关传播算法定位风险因素;实现异构数据融合,具有高效、低耗的优点,同时也达到了较高的准确率。

(2)本发明将特征分为城中村层面情景特征和场景层面情景特征,全面提取和评估城中村风险相关的特征,且在风险评估时将每个非城中村风险热点加入,提供了风险评估的准确性,此外,还采用逐层相关传播算法定位风险,显示特征和显示因素中的特征位置,准确且全面了分析了城中村风险,为城中村各类安全风险诊断系统提供全新有效的方法。

附图说明

图1本发明实施例技术方案的整体流程框架图;

图2本发明实施例提供的部分历史安全事件可视化示意图;

图3本发明实施例提供的城中村风险热点的建筑识别示意图;

图4本发明实施例提供的多视图神经网络示意图;

以下结合附图和具体实施例对本发明作进一步详述。

具体实施方式

如图1是本发明实施例技术方案的整体流程框架图,其共分为三个阶段,一是对城中村风险热点情景数据的收集,二是对热点情景特征的提取,三是对可解释性诊断模型的构建。

在城中村风险热点情景数据的收集阶段,首先定义城中村风险热点是一个结合时间和空间两方面内容的概念,每个风险热点需要城中村地点和时间综合确定。接下来,采用群智感知技术,收集事故发生相关数据,通过聚类算法得到城中村风险热点,并收集对应的热点情景数据,包括卫星图像、场景数据等,并将数据分为场景级别数据和城中村级别数据。在热点情景特征提取阶段,对于场景级别数据,对每个风险热点建立一张图,其中以场景作为节点,不同场景间的地理距离作为边。再采用在图嵌入上具有很好效果的GraphConvolution Network模型,输入城中村风险热点图,输出当前风险热点的特征。对于城中村级别数据,利用Mask R-CNN计算城中村风险热点的房屋数量,利用人口密度表计算城中村风险热点的人口数目,利用经验公式计算城中村风险热点的面积,再利用特征拼接将上述数据与城中村风险热点的每类场景数量得到每个风险热点的城中村级别特征。在可解释诊断模型的构建阶段,我们建立一个融合逐层相关传播算法的多视图残差网络,将上一个阶段提取的粗粒度特征和细粒度特征送入残差网络中,训练残差网络,从而评估每个城中村风险的高低,且解释评估结果的出现是哪些因素起到主要作用。

详述具体实施步骤为:

一种基于深度学习的城中村风险评估和风险因素定位方法,其特征在于,包括如下步骤:

S1:利用群智感知技术搜索各类风险事故,对每类风险事故进行聚类,将超过阈值的作为风险热点,并根据城中村风险热点获取风险热点情景数据,所述风险热点情景数据包括城中村层面情景数据和场景层面情景数据;

具体地,所述利用群智感知技术搜索各类风险事故,对每类风险事故进行聚类,将超过阈值的作为风险热点,具体为:

利用群智感知技术搜索各类风险事故,包括但不限于风险事故发生时间、发生地点、经纬度、事故类型信息;

对每类风险事故进行聚类,先从空间上对风险事故聚类,再从时间上对风险事故聚类,得到聚类结果,将超过阈值的记录作为风险热点。

传统上,研究人员将热点定义为特定事件频繁发生的地方,这样的定义忽略了事件中的时间信息。此外,在城中村,高风险事件的发生主要集中在特定的时间段。因此,我们不仅将其定义为地理空间信息,还将其定义为高风险的时空信息。因此,我们将一天分为六个时间段:上午(5:00-9:00)、中午(9:00-13:00)、下午(13:00-17:00)、黄昏(17:00-21:00)、晚上(21:00-1:00)、黎明(1:00-5:00)。我们用以下格式表示每个热点:城中村名-时间。

然后,我们收集厦门的一系列历史安全风险事件。由于缺乏安全历史事件的开放平台,收集它们是一项劳动密集且耗时的任务,因此我们使用群志感知系统以收集过去十年的事件。图2展示了一些历史安全风险事件及其在厦门岛上分布的可视化。

最后,我们将所有风险事件,按照位置对其进行聚类,然后根据周期标签对其进行聚类,得到一组热点。

具体地,并根据城中村风险热点获取风险热点情景数据,所述风险热点情景数据包括城中村层面情景数据和场景层面情景数据,具体为:

根据城中村风险热点搜索情景数据,所述风险热点情景数据包括城中村层面情景数据和场景层面情景数据;

对于城中村层面情景数据,收集风险热点的人口密度图、风险热点的卫星遥感图像;

对于场景级别情景数据,收集风险热点内部的场景信息,包括但不限于场景经纬度、街景信息、类型信息。

虽然城中村风险热点是由事件通过聚集大量事件发现,但没有足够的数据来表示每个城中村风险热点。因此,有必要从多个方面收集城中村风险热点的情景数据。我们从两个层面收集情景数据来全面描述城中村风险热点:城中村级别和场景级别。

在城中村级别,我们将每个城中村描述为一个整体。我们首先获得了过去十年全国人口密度图,用于计算每个城中村的总人口。然后收集每个城中村的遥感卫星图像,用于计算每个城中村的建筑数量和面积大小。此外,我们还收集了随时间变化的相关指标,包括温度、风速、湿度和风速,来描述城中村风险热点的时间序列特征。

在场景级别,我们收集了每个城中村的所有场景,并将其分为商店、旅游景点、公司、生活服务、餐厅、自助服务、娱乐设施、医院、旅馆等十类场景。对于每个场景,我们也收集其经纬度及街景图像,综合来描述这个场景。

S2:从城中村层面情景数据中提取城中村层面情景特征,从场景层面情景数据中提取场景层面情景特征;

具体地,从城中村层面情景数据中提取城中村层面情景特征,具体为:

根据城中村风险热点的经纬度和人口密度图的网格数据,得到每个城中村风险热点的人口数;

根据城中村风险热点的遥感图像,统计遥感图像像素点的数量,利用像素点大小以及数量计算当前热点的面积;

收集非热点城中村的遥感图像,标记每张卫星遥感图像中的各类建筑物目标作为训练集;利用该训练集训练一个Mask R-CNN模型至收敛;根据城中村风险热点的遥感图像,利用Mask R-CNN模型统计不同类型房屋的数量,如图3所示;

根据城中村风险热点的边界信息,统计风险热点内部的城中村层面关注点的数量,所述关注点包括但不限于商店、旅游景点、公司、生活服务、餐厅、自助服务、娱乐设施、医院、旅馆;

将上述人口数、面积、不同类型房屋的数量以及关注点的数量拼接在一起,得到当前风险热点的城中村层面情景特征。

具体地,从场景层面情景数据中提取场景层面情景特征,具体为:

根据城中村风险热点的边界信息,搜索城中村风险热点内部的场景,得到场景信息列表;

根据场景信息列表,获取包括但不限于场景的经纬度、类型、街景图数据信息;

获取非热点城中村内部的街景图,标记每张图片中的目标,所述目标包括但不限于煤气罐、广告牌、缠绕电线、电动车、移动板房、变压器以及木材堆,并将图片中的目标作为训练集,训练YoloV3模型至收敛;利用YoloV3模型提取城中村风险热点每个场景对应街景图的各目标数量以及最高置信度作为每个场景的特征;

根据每个城中村风险热点中场景的经纬度,计算每个热点中场景间距离大小;

以场景为结点,场景间的地理距离作为边的权重,建立每个城中村风险热点的图;

利用图形卷积网络GCN实现图嵌入,将对应边的特征融入相应结点中,得到场景层面情景特征。

S3:将城中村层面情景特征和场景层面情景特征输入构建的训练好的残差网络模型,评估城中村风险,并采用逐层相关传播算法定位风险因素。

具体地,还包括训练残差网络模型,具体为:

根据提取每个城中村风险热点的城中村层面情景特征和场景层面情景特征,构建训练集正样本;

根据提取每个非城中村风险热点的城中村层面情景特征和场景层面情景特征,构建训练集负样本;

构建残差网络模型,在训练集上进行训练至收敛,得到训练好的残差网络模型;

在训练好的残差网络模型上,将每个城中村风险热点的城中村层面情景特征和场景层面情景特征作为输入,分析城中村风险热点的风险。

具体地,所述采用逐层相关传播算法定位风险因素,具体为:

将城中村风险热点的风险结果输入逐层相关传播算法模块;

逐层相关传播算法模块输出城中村层面情景特征和场景层面情景特征的每个特征位置具体贡献度数值,并按特征贡献度排序;

输出设定排名的特征位置及名称。在以多视图方式表示每个风险热点后,接下来需要构建一个可解释性神经网络拟合这些特征。该模型不仅可以预测潜在风险事件的类型,还可以解释这些风险事件背后的原因。具体来说,首先建立一个多层神经网络来预测城中村的风险。接下来,使用逐层相关传播(LRP)来分析哪些因素主要影响导致风险的出现。

在此步骤中,基于两个层面的特征,使用分类模型评估潜在热点的风险。直观地说,我们可以将这些特征直接连接为向量来训练分类神经网络以对它们进行分类。然而,这种方法忽略了这些特征在潜在风险预测任务中的不同作用。具体而言,空间特征描述了场地的地理分布;例如,拥挤地点的分布将比城市村庄的其他地方有更高的风险。时间特征描述了不同时期外部环境因素的相关性,例如前几个小时的天气会对当前天气产生影响,从而导致当前环境中的风险事件。基本特征描述了整个城市村庄的各种基本信息,例如,面积越小,城市村庄越拥挤,风险越大。因此,我们构建了一个多视图神经网络(MvNN)来预测潜在风险,如图4所示。

在MvNN中,场地层面和城中村层面分别被视为视图A和视图B。对于每个视图,使用两个全连接层来生成具有相同大小的向量。然后,将两个预测向量相加并连接到一个全连接层来预测城中村的潜在风险。此外,在MvNN的每个全连接层后都会添加一个DropOut层,它休眠全连接层中部分神经元避免MvNN过拟合。同时,我们在每个全连接层中使用ReLU作为激活函数,并利用Adam优化器来训练模型。

至此,潜在风险预测模型可有效地使用多视图特征来预测潜在风险。但是,它只能输出最终的预测结果,而不能解释哪个特征有助于该结果的产生。对于政府来说,重要的是要了解每个预测的影响特征,以实施相应的预防措施。因此,在模型中将逐层相关传播(LRP)与风险预测模型相结合,以实现对潜在可解释风险因素的诊断。具体而言,使用逐层相关传播来监视和分析潜在风险预测模型的输入。当预测模型输出预测标签时,逐层关联传播将输出输入向量中哪个位置对结果贡献最大,并突出显示特征和显着因素中的特征位置。

逐层相关性传播(LRP)通过分解解释分类器的决策。在数学上,它使用局部重新分配规则来重新分配预测f(x)向后,直到分配相关分数Ri到每个输入变量。这种再分配过程的关键被称为相关性保护,可以概括为

该属性表示,在重新分配过程的每个步骤中,相关总量都得到了保存。在高风险因素的诊断中,由于风险预测模型的输入是多个视图的特征表示,可直接使用LRP来监视和计算输入向量在不同视图下的每个维度的贡献,并且突出显示那些在特征和显着因素的热图中贡献很大的位置外,我们可以从城中村层面和场景层面分析特征重要性,发现更可能引起不同风险事件的因素,促进城市当局对城市村庄进行更全面的管理。

本发明另一方面提供一种基于深度学习的城中村风险评估和风险因素定位系统,包括:

风险热点情景数据获取单元:利用群智感知技术搜索各类风险事故,对每类风险事故进行聚类,将超过阈值的作为风险热点,并根据城中村风险热点获取风险热点情景数据,所述风险热点情景数据包括城中村层面情景数据和场景层面情景数据;

情景特征获取单元:从城中村层面情景数据中提取城中村层面情景特征,从场景层面情景数据中提取场景层面情景特征;

风险评估和风险因素定位单元:将城中村层面情景特征和场景层面情景特征输入构建的训练好的残差网络模型,评估城中村风险,并采用逐层相关传播算法定位风险因素。

本发明实施例再一方面提供一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于执行上述基于城市大数据的道路障碍风险评估方法。

计算机指令(也称作程序、软件、软件应用或代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算机指令。术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(programmable logic device,PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。

上述仅为本发明的具体实施方式,但本发明的设计构思并不局限于此,凡利用此构思对本发明进行非实质性的改动,均应属于侵犯本发明保护范围的行为。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号