首页> 中国专利> 一种台风灾害下10kV杆塔受损风险评估方法及系统

一种台风灾害下10kV杆塔受损风险评估方法及系统

摘要

本发明提供一种台风灾害下10kV杆塔受损风险评估方法及系统,包括收集研究区域的数据,所述数据包括台风信息、电网信息和地理信息;对数据进行处理与分析,建立输入信息数据体系,所述处理与分析包括数据预处理、分类变量处理、样本均衡、相关性分析和变量剔除;基于多种机器学习算法,分别建立台风灾害下10kV杆塔受损风险评估模型,对各模型进行训练和测试,并对研究区域10kV杆塔进行受损风险评估;以拟合优度和时间两类指标作为模型评价指标,对比各模型的风险评估结果,基于层次分析法和熵权法对各指标进行综合赋权,选择最优模型,并将风险评估结果进行可视化。本发明满足不同场景下最优模型选择时的需求,为及时进行灾前巡检调拨提供实际数据支撑。

著录项

  • 公开/公告号CN112287018A

    专利类型发明专利

  • 公开/公告日2021-01-29

    原文格式PDF

  • 申请/专利权人 武汉理工大学;

    申请/专利号CN202011233274.7

  • 申请日2020-11-06

  • 分类号G06F16/26(20190101);G06F16/29(20190101);G06F16/215(20190101);G06F16/248(20190101);G06N3/04(20060101);G06N3/08(20060101);G06Q10/06(20120101);

  • 代理机构42222 武汉科皓知识产权代理事务所(特殊普通合伙);

  • 代理人严彦

  • 地址 430070 湖北省武汉市洪山区珞狮路122号

  • 入库时间 2023-06-19 09:43:16

说明书

技术领域

本发明涉及电力系统风险评估领域,具体涉及到一种台风灾害下10kV杆塔受损风险评估方法及系统。

背景技术

台风灾害往往会导致受灾区域电网输配电设备大量受损,给沿海地区电网带来了巨大威胁。专利文献CN103049646B提供了一种电网500kv终端变电站建设的综合风险评估方法,基于500kv终端变电站和周边的500kv电网、220kv电网的主要元件风险基础数据进行了研究。相比于主网,配网网络结构更为复杂,安全环境相对较差,影响其稳定运行的风险因素也相对较多,更易受到极端自然灾害的影响。同时,配网10kV杆塔设计规范相对较低,且数量较大,在台风灾害下更易发生断杆、倒杆等事故。

本申请发明人在实施本发明的过程中,发现现有技术的方法,至少存在如下技术问题:

目前已有研究者利用物理模型来实现电网的风险预测,物理模型具有预测精度较高的特点,但由于模型较为复杂,因此模型一般仅适用于样本数量较少的情况,且往往忽略了微地形对设备风险的影响,当样本数量增加或者自变量数量增加时,易导致模型运行时间过长,运行效率不高。在利用数据驱动模型进行风险评估的研究方面,由于电网数据收集体系的运行尚处于初级阶段,样本数量和数据质量欠佳,故模型的精度大多较低,因此现有模型大多将重点放在主网设备损失预测和模型预测精度的提升上,对更易受损的配网设备损失预测较少,且大多没有考虑模型运行时间对模型优劣的影响。但由于台风实时性较强,一些模型为了追求模型精度,可能在模型训练时间或者运行时间上耗费较多,对制定及时的应急调度策略造成一定影响。因此,本发明提出综合考虑模型精度和运行时间,研究基于数据驱动的10kV杆塔受损风险评估方法,对及时制定电网防风应急方案有重要意义。

发明内容

有鉴于此,本发明提供了一种台风灾害下10kV杆塔受损风险评估方法,用以解决配网杆塔受损预测模型较少、模型运行效率低、模型考虑因素不全面等技术问题。

为了解决上述技术问题,本发明提供了一种台风灾害下10kV杆塔受损风险评估方法,包括以下步骤:

步骤S1,收集研究区域的数据,所述数据包括台风信息、电网信息和地理信息;

步骤S2,对数据进行处理与分析,建立输入信息数据体系,所述处理与分析包括数据预处理、分类变量处理、样本均衡、相关性分析和变量剔除;

步骤S3,基于多种机器学习算法,建立各算法下的台风灾害下10kV杆塔受损风险评估模型,输入步骤S2处理完成的数据,对各模型进行训练和测试,并对研究区域10kV杆塔进行受损风险评估;

步骤S4,以拟合优度和时间两类指标作为模型评价指标,对比各模型的风险评估结果,基于层次分析法和熵权法对各指标进行综合赋权,选择最优模型,并将风险评估结果进行可视化。

而且,步骤S1中,台风信息由气象部门提供,包括台风下的最大阵风风速V;电网信息由电力部门提供,包括杆塔设计风速V

而且,步骤S2的实现方式包括以下子步骤,

步骤S2.1,数据预处理包括数据的缺省值填充、基准换算、标准化,实现如下,

对于数据不全的杆塔,采用中位数填充方式处理离散型数值变量,插值填充方式处理连续型数值变量,众数填充的方式处理分类变量;

将风速按Alt为杆塔所处海拔高度进行折算;

将存在量纲的原始数据进行标准化处理。

步骤S2.2,分类变量处理,包括对离散型多分类变量采用独热编码,所述多分类变量包括所处位置Loc、土质情况Soi、坡位SP、下垫面类型US和地表类型ST;

步骤S2.3,样本均衡,包括采用CondensedNearestNeighbour算法下采样组合SMOTE算法过采样对受损样本进行样本均衡;

步骤S2.4,相关性分析,对于连续型变量和二分类变量,绘制相关性热力图,由参数间的皮尔逊相关性系数大小判断拥有强相关性的变量,并综合考虑各因素对相关性较强的变量进行剔除;对于多分类变量,首先对变量进行独热编码,然后两两组合进行卡方检验,判断其显著性差异,用P值作为指标进行相关性判断,最后综合各多分类变量间的相关性和变量类型,剔除相应变量。

而且,步骤S3采用5种机器学习算法分别建立台风灾害下10kV杆塔受损风险评估模型,包括AdaBoost、梯度提升回归、K近邻回归、随机森林、支持向量回归算法。

而且,步骤S4中,拟合优度指标包括平均绝对误差MAE、均方误差MSE、矫正决定系数R

而且,步骤S4最优模型选择实现方式包括以下子步骤,

步骤S4.1,基于层次分析法的指标主观赋权,输出主观权值计算结果;

步骤S4.2,基于熵权法的指标客观赋权,输出客观权值计算结果;

步骤S4.3,综合赋权,包括采用线性加权的方式进行综合权值的计算如下,

ω=αω

式中,ω为综合权值,α为主观权重比例系数,ω

对各指标进行综合赋权后,根据各指标的综合权值对各种算法计算综合得分,对比各算法综合得分以选择所需场景下的最优模型,综合得分越高,代表综合考虑当前模型主观偏好性和客观性下该模型越优。

本发明还相应提供一种基于台风灾害下10kV杆塔受损风险评估系统,用于实现如上所述的一种基于台风灾害下10kV杆塔受损风险评估方法。

而且,包括以下模块,

第一模块,用于收集研究区域的数据,所述数据包括台风信息、电网信息和地理信息;

第二模块,用于对数据进行处理与分析,建立输入信息数据体系,所述处理与分析包括数据预处理、分类变量处理、样本均衡、相关性分析和变量剔除;

第三模块,用于基于多种机器学习算法,建立各算法下的台风灾害下10kV杆塔受损风险评估模型,输入处理完成的数据,对各模型进行训练和测试,并对研究区域10kV杆塔进行受损风险评估;

第四模块,用于以拟合优度和时间两类指标作为模型评价指标,对比各模型的风险评估结果,基于层次分析法和熵权法对各指标进行综合赋权,选择最优模型,并将风险评估结果进行可视化。

或者,包括处理器和存储器,存储器用于存储程序指令,处理器用于调用存储器中的存储指令执行如上所述的一种基于台风灾害下10kV杆塔受损风险评估方法。

或者,包括可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序执行时,实现如上所述的一种基于台风灾害下10kV杆塔受损风险评估方法。

本发明充分考虑了台风信息、电网信息和地理信息对杆塔受损的影响,通过相关性分析剔除部分变量以获取较为合理的输入数据,通过机器学习充分挖掘变量与杆塔受损之间的关系,并结合主观和客观因素进行最优模型的选择,该方法可满足电力运维部门在不同场景下最优模型选择时的需求,提供较为直观的10kV杆塔高风险区域分布图,具有较强的直观性和可操作性,可为及时进行灾前巡检和调拨等提供实际数据支撑。

附图说明

图1为本发明实施例台风灾害下10kV杆塔受损风险评估方法框架图。

具体实施方式

以下结合附图和实施例具体说明本发明的技术方案。

本发明在大量的研究与实践基础上发现:大多利用物理模型来实现极端天气下电网设备风险评估的方法往往较为复杂,一般仅适用于样本数量较少的情况,当样本数量增加或者自变量数量增加时,易导致模型运行时间过长,运行效率不高。由于电网数据收集体系的运行尚处于初级阶段,样本数量和数据质量欠佳,利用数据驱动模型进行风险评估的方法大多将重点放在主网设备损失预测,对更易受损的配网设备损失预测较少,且大多没有考虑模型运行时间对模型优劣的影响。

因此,本发明提供的一种台风灾害下10kV杆塔受损风险评估方法,首先,收集台风信息、电网信息和地理信息,对收集和提取的数据进行基准换算、标准化、分类变量处理、样本均衡、相关性分析等处理,并基于皮尔逊相关系数绘制相关性热力图,根据相关性分析结果选择最终输入数据;其次,利用AdaBoost、GBR、KNNR、RF、SVR等5种机器学习算法建立10kV杆塔受损风险评估模型;再次,基于层次分析法和熵权法进行拟合优度指标和时间指标的综合赋权,并对各模型进行评估,实现最优模型选取;最后,通过结果可视化输出杆塔受损风险评估结果。

参见图1,本实施例提供了一种台风灾害下10kV杆塔受损风险评估方法,该方法包括:

S1:收集研究区域的台风信息、电网信息和地理信息等;

在一种实施方式中,S1收集研究区域的数据中,台风信息由气象部门提供,主要指台风下的最大阵风风速V;电网信息由电力部门提供,主要包括:杆塔设计风速V

S2:对数据进行处理与分析,建立输入信息数据体系,具体包括数据的缺省值填充、基准换算、标准化、分类变量处理、样本均衡、相关性分析、变量剔除等;

在一种实施方式中,S2数据处理具体包括:

S2.1:数据预处理包括数据的缺省值填充、基准换算、标准化。

对于数据不全的杆塔,采用中位数填充方式处理离散型数值变量,插值填充方式处理连续型数值变量,众数填充的方式处理分类变量(包括二分类变量和离散型多分类变量),其中,训练样本中提前剔除数据缺失严重的杆塔样本。

考虑海拔高度对风速值的影响,将风速按式(1)进行折算:

式中,V

为了在不改变原始数据分布的情况下,增强不同量纲变量之间的可比性,将数据进行标准化处理:

式中,x’为标准化后的变量,x为存在量纲的原始数据,min(x)为同一类型变量中的最小值,max(x)为同一类型变量中的最大值。

S2.2:分类变量处理。对于离散型多分类变量,其取值没有大小的意义,因此使用独热编码解决模型应用时分类变量导致的偏序性问题。多分类变量包括:所处位置Loc、土质情况Soi、坡位SP、下垫面类型US、地表类型ST。

具体来说,以土质情况Soi为例,若杆塔1土质为可塑土,杆塔2为软塑土、杆塔3为细沙土、杆塔4为硬塑土,则杆塔1~4的编码方式如表1所示。

表1土质情况分类编码

S2.3:样本均衡。采用CondensedNearestNeighbour算法下采样组合SMOTE算法过采样对受损样本进行样本均衡。

CNN(CondensedNearestNeighbor)是最早的基于近邻分类的实例选择算法。SMOTE(Synthetic Minority Oversampling Technique)是合成少数类过采样技术。具体实现为现有技术,本发明不予赘述。

本发明提出利用CondensedNearestNeighbour算法,主要用于数据清洗,采用近邻的方法进行迭代以判断某样本应该保留还是剔除可有效剔除噪音数据,减少训练时间,同时提高样本质量,避免噪音样本对训练结果产生影响,防止过拟合。

S2.4:相关性分析。为了降低强相关性变量在模型训练中造成的影响,并且减轻模型在应用过程中数据收集的压力,对现有变量进行变量间的相关性分析。在相关性分析中,对于连续型变量和二分类变量,绘制相关性热力图,由参数间的皮尔逊相关性系数大小判断拥有强相关性的变量,并且,本发明进一提出综合考虑各因素对相关性较强的变量进行剔除。对于多分类变量,首先对变量进行独热编码,然后两两组合进行卡方检验,判断其显著性差异,用P值(双侧伴随概率)作为指标进行相关性判断,最后综合各多分类变量间的相关性和变量类型等,剔除相应变量。

具体来说,对于连续型变量(V

为了避免多分类变量的偏序性在模型拟合时造成的影响,对多分类变量进行独热编码,多分类变量包括:所处位置Loc、土质情况Soi、坡位SP、下垫面类型US、地表类型ST。将各多分类变量进行独热编码后,两两组合进行卡方检验,判断其显著性差异。首先绘制皮尔逊相关性系数图,然后用P值(双侧伴随概率)作为指标进行相关性判断,其中P值越接近于0,说明检验变量之间存在的相关性越显著,选择0.05为显著性水平。

用该方法对比多分类变量之间的两两相关性,可得其相关性强弱关系,在综合考虑相关性和分类数量的前提下,剔除多分类变量中的所处位置Loc。

S3:基于5种机器学习算法,建立各算法下的台风灾害下10kV杆塔受损风险评估模型,输入处理完成的数据,将输入数据随机划分为测试集和训练集,其中测试集占输入数据的80%,训练集占20%,对各模型进行训练和测试,并输出测试集的各评价指标结果;

具体实施时,可根据需要选择现有机器学习算法,实现方式可参考相应文献,本发明不予赘述。在一种实施方式中,S3的5种机器学习算法具体包括:AdaBoost、梯度提升回归(Gradient Boosting Regression,GBR)、K近邻回归(K Nearest Neighbor Regressor,KNNR)、随机森林(Random Forest,RF)、支持向量回归(Support Vector Regression,SVR),基于这5种机器学习算法分别建立台风灾害下10kV杆塔受损风险评估模型。以AdaBoost算法为例,首先将处理完成的数据作为输入,具体包括:最大阵风风速V、杆塔设计风速V

在一种实施方式中,S4的评价指标主要包括拟合优度指标和时间指标两大类,其中拟合优度指标具体包括:平均绝对误差(Mean Absolute Error,MAE)、均方误差(MeanSquare Error,MSE)、矫正决定系数(Adjusted R-Square,R

假设样本数量为m,第i个样本的真实值为y

其中,R

具体来说,用最终保留的变量作为输入,对5种机器学习算法进行参数寻优,并基于各算法对模型进行训练和测试,获得各模型风险评估效果对比如表2所示。

表2各模型风险评估效果对比

从表2中可见,拟合优度指标相对较优的模型是RF和GBR,MSE均在0.05以下,MAE均在0.12以下,R

S4:以拟合优度和时间两类指标作为模型评价指标,对比各模型的风险评估结果,基于层次分析法和熵权法对各指标进行综合赋权,选择最优模型,使用最优模型对研究区域的所有杆塔数据作为输入,进行基于最优模型的10kV杆塔受损风险评估,并将风险评估结果进行可视化。

在一种实施方式中,S4最优模型选择具体包括:

S4.1:基于层次分析法(The Analytic Hierarchy Process,AHP)的指标主观赋权。具体实施时,AHP计算主观权值的步骤为:

1)确定研究问题的层次结构,目标层为判断最优模型,准则层包括5个评价指标:MAE、MSE、R2_adj、Ttest、Trun,方案层包括5种机器学习算法:AdaBoost、GBR、KNNR、RF、SVR。

2)采用1~9分标度法对指标之间的重要性进行重要度量化,获得判断矩阵。

3)对判断矩阵进行一致性检验。

一致性比率CR和一致性指标CI的计算公式如式(7)-(8):

式中,RI为随机一致性指标,其取值与判断矩阵的阶数n有关;λ

4)输出主观权值计算结果。

具体来说,假设场景为距离台风登陆还有一定时间,模型已经训练完成,对训练时间要求较低,预测时间要求较低,但对预测的准确度要求较高,获得判断矩阵如表3所示。

构造判断矩阵时,数值越大,代表该行所代表的指标相对于该列所代表的指标重要程度越高。例:矫正决定系数R

表3判断矩阵

经过计算得一致性比率CR=0.037,小于0.1,判断矩阵通过一致性检验。各指标主观权值计算结果如表4所示。

表4各指标主观权值

S4.2:基于熵权法的指标客观赋权,计算客观权值步骤为:

1)对各指标进行标准化计算,构造评价矩阵。

对评价矩阵R的元素进行标准化。正向指标按照式(9)进行标准化计算,负向指标按式(10)计算。正向指标代表数值越大,模型效果越好,反之则为负向指标,如R

为防止标准化计算后结果为0的数据计算权值时权重过小,信息熵过大,将标准化结果为0的数字用0.01替代。

利用标准化后的数据构造评价矩阵。设采用m种算法,共有n个指标,则评价矩阵R=(r

2)计算第j个指标的熵值e

式中,P

3)计算第j个指标的熵权ω

4)输出客观权值计算结果。

具体来说,各指标客观权值计算结果如表5所示。

表5各指标客观权值

S4.3:综合赋权。为了适应不同使用者在不同应用场景中的偏好,采用线性加权的方式进行综合权值的计算。计算方法如式(15):

ω=αω'+βω” (15)

式中,ω为综合权值,α为主观权值比例系数,ω'为主观权值计算结果,β为客观权值比例系数,ω”为客观权值计算结果。其中:

α+β=1 (16)

为了剔除较大波动数据的干扰,引入距离函数的概念,采用线性组合法计算α和β。令ω'和ω”间的差异与α和β间的差异相同,即主观权值与客观权值的距离D(ω',ω”)等于主观权值比例系数与客观权值比例系数的距离D(α,β):

D(ω',ω”)=D(α,β) (17)

其中:

D(α,β)=|α-β| (19)

式中,下标i代表第i个指标,n为指标数量。

获得各指标的主观权值和客观权值后,联立式(16)和式(17),即可求出α和β,并得到各指标的综合权值。

对各指标进行综合赋权后,采用综合优度计算的方式对的5种算法进行评估:

式中,Score为模型的综合优度,ω

对比各算法综合优度以选择所需场景下的最优模型,综合优度值越大,代表综合考虑当前模型主观偏好性和客观性下该模型越优。

具体来说,根据主观和客观权值计算结果,联立方程组计算得主观权值比例系数为0.598,客观权值比例系数0.402,得各指标综合权值,并根据综合权值对5种模型进行综合优度对比,获得各模型综合优度如表6所示。

表6基于综合权值的各模型综合优度结果

从表6可见,评估结果最优的是GBR模型,其次为RF和KNNR,SVR和Adaboost模型综合优度较低,说明在对精度要求较高的假设场景下,综合考虑拟合优度指标和时间指标的前提下,GBR模型拥有最好的评估效果。

具体实施时,本发明技术方案提出的方法可由本领域技术人员采用计算机软件技术实现自动运行流程,实现方法的系统装置例如存储本发明技术方案相应计算机程序的计算机可读存储介质以及包括运行相应计算机程序的计算机设备,也应当在本发明的保护范围内。

在一些可能的实施例中,提供一种基于台风灾害下10kV杆塔受损风险评估系统,包括以下模块,

第一模块,用于收集研究区域的数据,所述数据包括台风信息、电网信息和地理信息;

第二模块,用于对数据进行处理与分析,建立输入信息数据体系,所述处理与分析包括数据预处理、分类变量处理、样本均衡、相关性分析和变量剔除;

第三模块,用于基于多种机器学习算法,建立各算法下的台风灾害下10kV杆塔受损风险评估模型,输入处理完成的数据,对各模型进行训练和测试,并对研究区域10kV杆塔进行受损风险评估;

第四模块,用于以拟合优度和时间两类指标作为模型评价指标,对比各模型的风险评估结果,基于层次分析法和熵权法对各指标进行综合赋权,选择最优模型,并将风险评估结果进行可视化。

在一些可能的实施例中,提供一种基于台风灾害下10kV杆塔受损风险评估系统,包括处理器和存储器,存储器用于存储程序指令,处理器用于调用存储器中的存储指令执行如上所述的一种基于台风灾害下10kV杆塔受损风险评估方法。

在一些可能的实施例中,提供一种基于台风灾害下10kV杆塔受损风险评估系统,包括可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序执行时,实现如上所述的一种基于台风灾害下10kV杆塔受损风险评估方法。

本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号