首页> 中国专利> 一种基于机器学习的电网地质沉降隐患风险预测方法

一种基于机器学习的电网地质沉降隐患风险预测方法

摘要

本申请提供一种基于机器学习的电网地质沉降隐患风险预测方法,包括:确定电网地理区域,并以预设的间隔将所述电网地理区域划分为地理网格;获取样本地理网格中的第一特征数据并进行相应的处理;将第一特征数据和第一预测变量,输入训练模型中,获得电网地质沉降隐患点分类预测模型;将待预测地理网格的第二特征数据输入至电网地质沉降隐患点分类预测模型中,得到第二预测变量;若所述第二预测变量为1,则待预测地理网格存在电网地质沉降隐患风险点。本申请能够有效解决卫星定点监测周期较长,并且得出的预测结果,可以给各个应急单位提供应对电网地质沉降的辅助指导,并且可以及时发现电网地质沉降隐患风险点,提前做好应急处理的方案。

著录项

  • 公开/公告号CN112836897A

    专利类型发明专利

  • 公开/公告日2021-05-25

    原文格式PDF

  • 申请/专利号CN202110240319.1

  • 申请日2021-03-04

  • 分类号G06Q10/04(20120101);G06Q10/06(20120101);G06Q50/06(20120101);

  • 代理机构11363 北京弘权知识产权代理有限公司;

  • 代理人逯长明;许伟群

  • 地址 650217 云南省昆明市经济技术开发区云大西路105号

  • 入库时间 2023-06-19 11:05:16

说明书

技术领域

本申请涉及电网地质沉降隐患风险预测技术领域,尤其涉及一种基于机器学习的电网地质沉降隐患风险预测方法。

背景技术

由于电网中的设备,如输电线路分布范围较广且地理环境多样,地质沉降灾害在自然或人为因素的影响下对电网设备的安全可靠运行威胁较大。一旦电网中变电站或输电杆塔受到地质沉降的影响将造成严重设备损坏,进而造成巨大的经济及社会损失。

目前,对于电网地质沉降分析主要基于SAR卫星数据进行干涉处理,但是采用SAR卫星数据处理精度受时间失相干及空间失相干的影响较大,特别是对于地形复杂、植被茂盛的地区,更要求经验丰富的工作人员,尚不能满足电网地质沉降运维的需求。同时,电网地质沉降隐患风险还受多方面的影响,如地理因素、气象因素、地质因素、电网因素及人为因素等,因此,现有的基于SAR卫星数据的分析处理不能及时发现电网中可能存在的地质沉降隐患风险,降低了电网运维人员的效率,也不能及时进行相应灾害的防御及处置,导致因隐患排查不及时造成经济损失。

发明内容

本申请提供了一种基于机器学习的电网地质沉降隐患风险预测方法,以解决现有技术中存在的不能及时发现电网中可能存在的地质沉降隐患风险,降低了电网运维人员的效率,以及不能及时进行相应灾害的防御及处置,导致因隐患排查不及时造成经济损失的问题。

本申请提供一种基于机器学习的电网地质沉降隐患风险预测方法,具体包括如下步骤:

确定电网地理区域,并以预设的间隔将所述电网地理区域划分为地理网格,其中,所述地理网格包括样本地理网格和待预测地理网格,所述样本地理网格中包括第一特征数据和与所述第一特征数据相对应的第一预测变量,所述第一预测变量为已知变量,所述待预测地理网格中包括第二特征数据和与所述第二特征数据相对应的第二预测变量,所述第二预测变量为未知变量;

获取所述样本地理网格中的第一特征数据并进行相应的处理;

将所述第一特征数据和所述第一预测变量,输入训练模型中,获得电网地质沉降隐患点分类预测模型;

将所述待预测地理网格的第二特征数据输入至所述电网地质沉降隐患点分类预测模型中,得到所述第二预测变量;

若所述第二预测变量为1,则所述待预测地理网格存在电网地质沉降隐患风险点。

在本申请的较佳实施例中,若所述第二预测变量为0,则所述待预测地理网格不存在电网地质沉降隐患风险点。

上述技术方案中,得到所述待预测地理网格的隐患风险信息后,还需要对所述隐患风险信息进行核查,并输出核查结果。

在本申请的较佳实施例中,将所述第一特征数据和所述第一预测变量,输入训练模型中,获得电网地质沉降隐患点分类预测模型,包括:

将所述第一特征数据和所述第一预测变量分别划分为训练集数据和测试集数据;

对所述训练集数据进行训练,得到所述电网地质沉降隐患点分类预测模型;

采用所述测试集数据测试所述电网地质沉降隐患点分类预测模型的模型指标,并计算所述模型指标的平均值。

在本申请的较佳实施例中,所述模型指标主要包括召回率和精确率,具体公式如下:

其中,R

上述技术方案中,召回率指的是在所有存在隐患风险的样本地理网格中,被正确识别为隐患风险网格的比例;精确率指的是在被识别为隐患风险网格的样本地理网格中,确实为隐患风险网格的比例。

在本申请的较佳实施例中,所述第一特征数据主要包括地理样本数据、地质样本数据、气象样本数据和电网样本数据。

上述技术方案中,地理样本数据包括海拔高度、坡度、坡向、坡位、植被覆盖率等,其中,地理样本数据中坡度、坡向及坡位数据由DEM数据生成;地质样本数据包括土壤类型、岩石种类、地下水含量、土地利用类型等;气象样本数据包括温度和降雨量等;电网样本数据包括电压等级、地理网格中的杆塔数量以及其是否属于重要关键线路等,对上述样本数据中的连续型样本数据进行归一化处理,对离散型数据进行one-hot编码,由于使用的降雨量监测装置并不精确,为此将其处理为离散变量,进行one-hot编码处理。

本申请的一种基于机器学习的电网地质沉降隐患风险预测方法,相较于现有技术而言,具有以下有益效果:

(1)本申请的电网地质沉降隐患风险预测方法,能够综合考虑影响电网地质沉降的地理因素、地质因素、气象因素、电网因素及人为因素,构建相对有效的电网地质沉降隐患风险预测模型,能够有效解决卫星定点监测周期较长,以及对工作人员的经验要求较高的问题。

(2)本申请的预测方法得出的预测结果,可以给各个应急单位提供应对电网地质沉降的辅助指导,并且可以及时发现电网地质沉降隐患风险点,提前做好应急处理的方案。

附图说明

为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请一种基于机器学习的电网地质沉降隐患风险预测方法的流程图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。

因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

本申请中说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似或同类的对象或实体,而不必然意味着限定特定的顺序或先后次序,除非另外注明(Unless otherwise indicated)。应该理解这样使用的用语在适当情况下可以互换,例如能够根据本申请实施例图示或描述中给出那些以外的顺序实施。

此外,术语“包括”和“主要包括”以及他们的任何变形,意图在于覆盖但不排他的包含,例如,包含了一系列组件的产品或设备不必限于清楚地列出的那些组件,而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。

实施例

参见图1,为一种基于机器学习的电网地质沉降隐患风险预测方法的流程图。

如图1所示,本申请提供的一种基于机器学习的电网地质沉降隐患风险预测方法,具体包括如下步骤:

S101,确定电网地理区域,并以预设的间隔将所述电网地理区域划分为地理网格,其中,所述地理网格包括样本地理网格和待预测地理网格,所述样本地理网格中包括第一特征数据和与所述第一特征数据相对应的第一预测变量,所述第一预测变量为已知变量,所述待预测地理网格中包括第二特征数据和与所述第二特征数据相对应的第二预测变量,所述第二预测变量为未知变量;

S102,获取所述样本地理网格中的第一特征数据并进行相应的处理;

S103,将所述第一特征数据和所述第一预测变量,输入训练模型中,获得电网地质沉降隐患点分类预测模型;

S104,将所述待预测地理网格的第二特征数据输入至所述电网地质沉降隐患点分类预测模型中,得到所述第二预测变量;

S105,若所述第二预测变量为1,则所述待预测地理网格存在电网地质沉降隐患风险点。

在本实施例中,进一步地,若所述第二预测变量为0,则所述待预测地理网格不存在电网地质沉降隐患风险点。

上述技术方案中,得到所述待预测地理网格的隐患风险信息后,还需要对所述隐患风险信息进行核查,并输出核查结果。

在本实施例中,核查需要确定隐患风险网格中是否存在电网设备,如杆塔,并且还需要判断隐患风险网格是否属于重要关键线路,能够进一步避免误报,同时可以将核查后的隐患风险信息发送给运维工作人员,以加强巡视,提前做好防止措施。

在本实施例中,步骤S101中,划分地理网格以电网地理区域的左下角为网格划分起点,预设的间隔为1km(0.01°)进行网格划分,将电网地理区域划分为大小均为1km*1km的地理网格。

在上述具体实施方式基础上,进一步地,步骤S102中的所述第一特征数据主要包括地理样本数据、地质样本数据、气象样本数据和电网样本数据。

上述技术方案中,地理样本数据包括海拔高度、坡度、坡向、坡位、植被覆盖率等,其中,地理样本数据中坡度、坡向及坡位数据由DEM数据生成;地质样本数据包括土壤类型、岩石种类、地下水含量、土地利用类型等;气象样本数据包括温度和降雨量等;电网样本数据包括电压等级、地理网格中的杆塔数量以及其是否属于重要关键线路等,对上述样本数据中的连续型样本数据进行归一化处理,对离散型数据进行one-hot编码,由于使用的降雨量监测装置并不精确,为此将其处理为离散变量,进行one-hot编码处理。

在本实施例中,对海拔高度数据可以选择SRTM DEM数据,也可基于SAR卫星(例如哨兵1)数据提取需要的DEM数据,坡度、坡向及坡位数据则借助于地理信息系统,并基于获得的DEM数据生成,植被覆盖率则可通过NDVI指数反映;对土地利用类型可分为6类,分别为耕地、林地、草地、水域、居民用地及未利用土地等,若样本地理网格中土地利用类型为耕地,则相对应的编码应该为100000;由于降雨量监测装置并不精确,因此将降雨量处理为离散变量,按区间分为无雨、小雨、中雨、大雨、暴雨及特大暴雨等6类,划分依据为:

降雨量0mm为无雨;降雨量小于10mm为小雨;降雨量在10mm-25mm为中雨,降雨量在25mm-50mm为大雨;降雨量在50mm-100mm为暴雨;降雨量大于100mm为特大暴雨;对连续样本数据采用最大最小值归一化进行处理。

需要特别说明的是,在本实施例中,第一特征数据还包括人为样本数据,具体主要包括居民规模、工厂规模、地下施工情况和地面施工情况。另外,第一特征数据的具体的选择可以根据实际应用情况而定,本申请中列举出的仅是为了更好说明技术方案,给出的示例。

在上述具体实施方式基础上,进一步地,步骤S103具体包括:

将所述第一特征数据和所述第一预测变量分别划分为训练集数据和测试集数据;

对所述训练集数据进行训练,得到所述电网地质沉降隐患点分类预测模型;

采用所述测试集数据测试所述电网地质沉降隐患点分类预测模型的模型指标,并计算所述模型指标的平均值。

在本实施例中,对第一特征数据进行划分时,具体是将其划分为n等份,其中n-1份为训练集数据,剩余1份为测试集数据,需要说明的是,n的取值范围根据样本量大小而定,一般取5-10;根据上述方法对n-1份训练集数据进行训练,剩余1份测试集数据根据上述公式求取召回率和精确率,且重复n次求模型指标的平均值。

进一步需要说明的是,训练模型算法可以选择随机森林、SVM、GBDT或者逻辑回归,也可以选择几种算法结合,具体根据实际需要选择。

在上述具体实施方式基础上,进一步地,所述模型指标主要包括召回率和精确率,具体公式如下:

其中,R

上述技术方案中,召回率指的是在所有存在隐患风险的样本地理网格中,被正确识别为隐患风险网格的比例;精确率指的是在被识别为隐患风险网格的样本地理网格中,确实为隐患风险网格的比例。

本申请提供的实施例之间的相似部分相互参见即可,以上提供的具体实施方式只是本申请总的构思下的几个示例,并不构成本申请保护范围的限定。对于本领域的技术人员而言,在不付出创造性劳动的前提下依据本申请方案所扩展出的任何其他实施方式都属于本申请的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号