首页> 中国专利> 一种基于RMSE的电网缺陷物资需求准确度的模型融合方法

一种基于RMSE的电网缺陷物资需求准确度的模型融合方法

摘要

本发明公开了一种基于RMSE的电网缺陷物资需求准确度的模型融合方法,包括,基于电网设备物资缺陷数据和当前气象数据,训练多个基准模型,输出预测结果;根据所述预测结果的RMSE取值,对所述多个基准模型进行权重评估;利用所述权重进行加权求和,获得高精度的融合预测模型。本发明一方面以均方误差(RMSE)作为权重来对模型进行加权,衡量模型的重要性;另一方面通过加权调整过的数据,验证了本方法确实能够有效提升预测精度,降低预测误差。

著录项

  • 公开/公告号CN112836880A

    专利类型发明专利

  • 公开/公告日2021-05-25

    原文格式PDF

  • 申请/专利权人 贵州电网有限责任公司;

    申请/专利号CN202110170210.5

  • 申请日2021-02-08

  • 分类号G06Q10/04(20120101);G06Q50/06(20120101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);G06N20/20(20190101);

  • 代理机构32272 南京禹为知识产权代理事务所(特殊普通合伙);

  • 代理人王晓东

  • 地址 550002 贵州省贵阳市南明区滨河路17号

  • 入库时间 2023-06-19 11:05:16

说明书

技术领域

本发明涉及物资需求预测、精度提升的技术领域,尤其涉及一种基于RMSE的电网缺陷物资需求准确度的模型融合方法。

背景技术

电力系统的稳定运行,离不开不间断的维护和检修,当设备发生故障时,要能够根据情况及时的进行检修和更换,但是各个地方的地理环境、气候环境、用电情况都不一样,这导致不同的地方设备发生故障的概率是不一样的,如果都等量的进行物资储备,那么可能有的地方物资过剩,有的地方物资紧缺,另一方面,物资的存储也是需要成本的,对仓储资源的价值最大化,也是需要考虑的问题,因此,因地制宜的进行物资仓储,离不开精准的需求预测,而需求的预测,则来自于历史的缺陷物资的数据信息。

目前的研究主要都针对单一缺陷物资进行预测,针对不同区县不同物资的预测也有相应的方法在做,往往是一个模型去预测所有物资,这种方法存在很大的问题,首先是物资分布不一致,有的数据分布稠密,有的数据分布很分散,而且数据的极值也不一样。

针对不同地区不同的物资需求进行预测,考虑到数据的特性,有的提出了针对每个地区的每类物资都采用多个模型,然后对模型进行融合得到最终的模型,常用的有stacking融合和平均融合,但是平均融合过于简单,stacking融合又非常依赖于第二级的学习器的选择,这无疑中增加了很多工作量。

发明内容

本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。

鉴于上述现有存在的问题,提出了本发明。

因此,本发明提供了一种基于RMSE的电网缺陷物资需求准确度的模型融合方法,能够解决电网缺陷物资需求预测精度低下、模型融合依赖性较强的问题。

为解决上述技术问题,本发明提供如下技术方案:包括,基于电网设备物资缺陷数据和当前气象数据,训练多个基准模型,输出预测结果;根据所述预测结果的RMSE取值,对所述多个基准模型进行权重评估;利用所述权重进行加权求和,获得高精度的融合预测模型。

作为本发明所述的基于RMSE的电网缺陷物资需求准确度的模型融合方法的一种优选方案,其中:所述电网设备物资缺陷数据包括,处理措施、处理情况描述、缺陷等级、调管单位、设备类别、发现时间、缺陷原因、缺陷部位、生产厂家、出厂年月、投运日期、缺陷原因类别、缺陷所属区域。

作为本发明所述的基于RMSE的电网缺陷物资需求准确度的模型融合方法的一种优选方案,其中:所述气象数据包括,气温、相对湿度、气压、风速、风向、降水量、云量、能见度、天气现象。

作为本发明所述的基于RMSE的电网缺陷物资需求准确度的模型融合方法的一种优选方案,其中:所述多个基准模型包括,基学习器岭回归模型、lasso回归模型、ENET回归模型、GBDT模型、XgBoost模型和BP神经网络模型。

作为本发明所述的基于RMSE的电网缺陷物资需求准确度的模型融合方法的一种优选方案,其中:利用所述基学习器岭回归模型、所述lasso回归模型和所述ENET回归模型对所述电网设备物资缺陷数据进行优化求解,包括,

其中,n

作为本发明所述的基于RMSE的电网缺陷物资需求准确度的模型融合方法的一种优选方案,其中:还包括,

其中,

作为本发明所述的基于RMSE的电网缺陷物资需求准确度的模型融合方法的一种优选方案,其中:所述电网物资特征数据包括,设备投运日期、生产厂家,缺陷发生日期、发生缺陷时气象温度、湿度、是否大雪天气。

作为本发明所述的基于RMSE的电网缺陷物资需求准确度的模型融合方法的一种优选方案,其中:所述GBDT模型和所述XgBoost模型对求解后的函数进行预测,包括,

其中,K为模型有K个分类回归树,Γ为模型的分类回归树空间。

作为本发明所述的基于RMSE的电网缺陷物资需求准确度的模型融合方法的一种优选方案,其中:所述BP神经网络模型对求解后的函数进行预测,包括,

其中,w

作为本发明所述的基于RMSE的电网缺陷物资需求准确度的模型融合方法的一种优选方案,其中:还包括,所述GBDT模型、所述XgBoost模型和所述BP神经网络模型分别进行预测训练,输出预测结果;根据模型的均方误差的倒数作为所述基学习器的权重,利用基学习模型预测得到预测值;根据所述基学习模型对应的权重乘以所述预测结果,将所有模型加权的结果进行求和,获得加权融合的所述预测模型。

本发明的有益效果:本发明一方面以均方误差(RMSE)作为权重来对模型进行加权,衡量模型的重要性;另一方面通过加权调整过的数据,验证了本方法确实能够有效提升预测精度,降低预测误差。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:

图1为本发明一个实施例所述的基于RMSE的电网缺陷物资需求准确度的模型融合方法的流程示意图;

图2为本发明一个实施例所述的基于RMSE的电网缺陷物资需求准确度的模型融合方法的算法伪代码示意图;

图3为本发明一个实施例所述的基于RMSE的电网缺陷物资需求准确度的模型融合方法的优化训练预测后的算法伪代码示意图;

图4为本发明一个实施例所述的基于RMSE的电网缺陷物资需求准确度的模型融合方法的各区县物资模型融合RMSE对比示意图;

图5为本发明一个实施例所述的基于RMSE的电网缺陷物资需求准确度的模型融合方法的各区县各物资模型融合的总RMSE对比示意图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。

在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。

其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。

本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。

同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。

本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

实施例1

参照图1,为本发明的第一个实施例,提供了一种基于RMSE(均方误差)的电网缺陷物资需求准确度的模型融合方法,包括:

S1:基于电网设备物资缺陷数据和当前气象数据,训练多个基准模型,输出预测结果。其中需要说明的是,电网设备物资缺陷数据包括:

处理措施、处理情况描述、缺陷等级、调管单位、设备类别、发现时间、缺陷原因、缺陷部位、生产厂家、出厂年月、投运日期、缺陷原因类别、缺陷所属区域;

气象数据包括,气温、相对湿度、气压、风速、风向、降水量、云量、能见度、天气现象;

多个基准模型包括,基学习器岭回归模型、lasso回归模型、ENET回归模型、GBDT模型、XgBoost模型和BP神经网络模型。

具体的,利用基学习器岭回归模型、lasso回归模型和ENET回归模型对电网设备物资缺陷数据进行优化求解,包括:

其中,n

其中,

电网物资特征数据包括,设备投运日期、生产厂家,缺陷发生日期、发生缺陷时气象温度、湿度、是否大雪天气;

GBDT模型和XgBoost模型对求解后的函数进行预测,包括,

其中,K为模型有K个分类回归树,Γ为模型的分类回归树空间;

BP神经网络模型对求解后的函数进行预测,包括,

其中,w

S2:根据预测结果的RMSE取值,对多个基准模型进行权重评估。

S3:利用权重进行加权求和,获得高精度的融合预测模型。本步骤需要说明的是:

GBDT模型、XgBoost模型和BP神经网络模型分别进行预测训练,输出预测结果;

根据模型的均方误差的倒数作为基学习器的权重,利用基学习模型预测得到预测值;

根据基学习模型对应的权重乘以预测结果,将所有模型加权的结果进行求和,获得加权融合的预测模型。

参照图2,为本发明的算法伪代码,描述了本发明方法的整个流程,模型的输入为区县集合、各个区县下各类物资数据集合、基学习器集合,输出的预测结果是每个区域的所有训练出来的最优模型的模型权重集合。

较佳的是,本发明方法对每个区县下的每类缺陷物资的每个基学习器都进行最优化训练,得到模型在该区县下该类物资的均方误差(RMSE),对所有基学习器的RMSE求倒数再求和,通过RMSE的倒数除以倒数和得到该模型的权重。

参照图3,是在经过图2的优化训练之后,利用模型及权重的结果做预测的算法伪代码,通过加权求和,得到最终各个区县各类物资的预测结果。

优选的,本发明提出的基于RMSE的提升缺陷物资预测精度的方法,该方法能够很好的体现各个缺陷物资预测模型的精度,并提升其重要性,同时,也能避免掉因为精度最好而选择单一模型、其实是过拟合所导致的问题。

实施例2

参照图4和图5,为本发明的第二个实施例,该实施例不同于第一个实施例,提供了一种基于RMSE的电网缺陷物资需求准确度的模型融合方法的测试验证,包括:

对了更好地对本方法中采用的技术效果加以验证说明,本实施例选择传统单一模型和传统的多模型融合方法与本发明方法进行对比测试,以科学论证的手段对比试验结果,以验证本方法所具有的真实效果。

传统的技术方案一:采用单一模型进行缺陷物资预测,例如仅仅使用基学习器进行缺陷物资预测,考虑到本问题的实际情况,目标是实现各个区县各类缺陷物资的精准预测,那么单一模型必然无法实现上述目标,因为各个地区的气象数据会有差异,不同物资的损坏程度、时空分布也存在差异。

传统技术方案二:采用多模型融合来提高预测精度,将模型做为基学习器,然后将基学习器的结果进行融合,最常见的融合方式是平均加权融合以及Stacking融合,平均加权融合的缺点在于过于简单粗暴,Stacking的方法则缺点是相对复杂,且精度依赖于第二阶段的融合模型。

本发明技术方案相比于传统技术方案,精度有着本质上的提升,相比于传统方案二中的平均加权融合方法,以及Stacking的方法,本发明方案基于RMSE的倒数进行加权求和,并根据RMSE的阈值来过滤掉过拟合的模型,进一步提高预测的精度,本方案兼具简单性以及在兼顾效率的同时尽可能的提高了预测精度。

为验证本发明方法相对传统方法具有简单性以及高精度,本实施例中将采用传统传统方案一中的单模型预测方法和传统方案二中的平均加权融合方法以及Stacking的方法进行了对比,利用真实的电网缺陷物资数据,结合气象数据,来进行预测评估。

测试环境:利用真实的电网缺陷物资数据,结合气象数据,利用Python编写代码,来对三个方案进行对比分析,预测的时候,对每个区县的每类数据都进行一个预测,然后计算真实数据与预测结果的均方误差RMSE。

参照图3,经过平均加权融合、stacking融合以及基于RMSE调整加权融合的预测结果,对比很明显,平均融合、stacking融合的结果都高出基于RMSE加权的融合结果。

参照图4,平均融合、stacking融合的结果在各区县、各物资的总的RMSE是远远高过基于RMSE调整之后加权融合的结果的,相比平均融合RMSE降低了44%,相比stacking融合降低了72%。

应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号