首页> 中国专利> 一种基于梯度提升决策树的短期负荷预测方法

一种基于梯度提升决策树的短期负荷预测方法

摘要

本发明实施例公开了一种基于梯度提升决策树的短期负荷预测方法,包括获取待预测日前N天的历史负荷数据,形成原始数据集A0;从原始数据集A0中筛选出构建训练样本的数据集B;利用数据集B构造GBDT预测模型所需的全部样本集(X,Y);由全部样本集(X,Y)训练构造全天GBDT预测模型,根据全天GBDT预测模型预测待预测日的全天负荷向量;将全部样本集(X,Y)按小时分割为24个样本子集,并分别训练构造小时GBDT预测模型,并根据小时GBDT预测模型预测待预测日的24小时负荷向量;结合全天负荷向量和24小时负荷向量,预测待预测日的最终负荷向量。本发明充分挖掘历史负荷数据中的特征并构造不同的梯度提升决策树模型来提高短期负荷预测的精度。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-02-15

    专利权的转移 IPC(主分类):H02J 3/00 专利号:ZL2018104435138 登记生效日:20220129 变更事项:专利权人 变更前权利人:国网山东省电力公司电力科学研究院 变更后权利人:国网山东省电力公司营销服务中心(计量中心) 变更事项:地址 变更前权利人:250002 山东省济南市市中区望岳路2000号 变更后权利人:250001 山东省济南市市中区大观园经二路150号 变更事项:专利权人 变更前权利人:国家电网有限公司 变更后权利人:国网山东省电力公司电力科学研究院 国家电网有限公司

    专利申请权、专利权的转移

  • 2020-04-21

    授权

    授权

  • 2018-10-16

    实质审查的生效 IPC(主分类):H02J3/00 申请日:20180510

    实质审查的生效

  • 2018-09-14

    公开

    公开

说明书

技术领域

本发明涉及电力系统负荷预测技术领域,具体地说是一种基于梯度提升决策树的短期负荷预测方法。

背景技术

负荷预测是根据系统的运行特性、增容决策、自然条件与社会影响等诸多因数,在满足一定精度要求的条件下,确定未来某特定时刻的负荷数据,其中负荷是指电力需求量(功率)或用电量,负荷预测是电力系统经济调度中的一项重要内容。准确的负荷预测,可以经济合理地安排电网内部发电机组的启停,保持电网运行的安全稳定性,减少不必要的旋转储备容量,合理安排机组检修计划,保障社会的正常生产和生活,有效地降低发电成本,提高经济效益和社会效益。

目前短期负荷预测的方法较多,主要采用时间序列、回归分析、专家系统法、支持向量机和神经网络等方法,这些算法各具优缺点,适应的范围各不相同。但由于存在各种信息获取的限制,在缺少除了历史负荷数据之外的诸如天气温度等信息的情况下,上述算法的预测精度普遍较低。

发明内容

本发明实施例中提供了一种基于梯度提升决策树的短期负荷预测方法,以解决现有技术中负荷预测精度低的问题。

为了解决上述技术问题,本发明实施例公开了如下技术方案:

一种基于梯度提升决策树的短期负荷预测方法,包括以下步骤:

获取待预测日前N天的历史负荷数据,形成原始数据集A0

从原始数据集A0中筛选出构建训练样本的数据集B;

利用数据集B构造GBDT预测模型所需的全部样本集(X,Y);

由全部样本集(X,Y)训练构造全天GBDT预测模型,根据全天GBDT预测模型预测待预测日的全天负荷向量;

将全部样本集(X,Y)按小时分割为24个样本子集,并分别训练构造小时GBDT预测模型,根据小时GBDT预测模型预测待预测日的24小时负荷向量;

结合全天负荷向量和24小时负荷向量,预测待预测日的最终负荷向量。

进一步地,所述原始数据集A0中,每天的数据作为一个原始数据样本,每个样本中,将当天每小时的负荷数据和时间数据分别作为数据点。

进一步地,所述从原始数据集A0中筛选出构建训练样本的数据集B的具体过程为:

从原始数据集A0中筛选出与待预测日的日期类型相同的数据集,记为A1

根据正常数据点的判定条件,过滤A1中的异常数据,并统计A0中正常负荷点的个数,将正常负荷点的个数大于设定值的样本加入正常数据集A2

从A2中筛选出与待预测日相似的M天,记为数据集B。

进一步地,所述从A2中筛选出与待预测日相似的M天的具体过程为:以待预测日前一天负荷数据向量与A2中所有样本负荷数据向量的欧式距离rd作为相似度的度量,相似度最大的M天数据加入数据集B,M的取值公式为

M=min(30,[P*0.7]),

式中,P为数据集A2的样本个数,[]表示向下取整数,min()表示取括号中二者值之间较小的一个。

进一步地,所述全部样本集(X,Y)为

(X,Y)={(xj,i,yj,i)|i=0,1,2,...,23;j=1,2,...,M}’

式中xj,i表示由数据集B中第j个样本i时的负荷数据点构造出的训练输入特征向量xj,i,yj,i表示数据集B中第j个样本i时的负荷值,构造为对应训练样本的响应值。

进一步地,所述全天GBDT预测模型由L=1000棵深度为3的最小二乘回归树组成,将训练第m棵数得到的模型记为Tm(x),训练第m棵最小二乘回归树模型Tm(x)的具体过程为:

(a)计算前m-1棵树综合预测模型的针对所有训练样本xj,i得到的预测值fm-1(xj,i),

(b)计算前m-1棵树得到的预测值与真实值的残差residualm,j,i,所有的残差residualm,j,i构成新的训练样本响应集,即

Rm={residualm,ji|i=0,1,2,...,23;j=1,2,...,M}

(c)将训练样本特征集X与训练样本响应集Rm共同构成新的训练数据集(X,Rm),由(X,Rm)训练一棵深度为3的最小二乘回归树T′m(x);

利用公式Tm(x)=λ*T′m(x)计算,得到最终的第m棵树的模型Tm(x),

按照步骤(a)-(d),训练第1至L棵树,得到全天GBDT预测模型f_day(x)。

进一步地,将待预测日的负荷向量记为

ay_pred=[dayload0,dayload1,...,dayload23],所述根据全天GBDT预测模型预测待预测日的全天负荷向量的具体过程为:

初始化预测时刻i=0;

构建i时待预测负荷的特征向量xi

递归预测i时的负荷dayloadi,构成特征向量xi,其中i的取值为0~23的整数。

进一步地,从样本集(X,Y)中取出所有由i时的负荷点得到的样本(xj,i,yj,i),构成i时的训练样本子集(Xi,Yi),所述小时GBDT预测模型由L=500棵深度为3的最小二乘回归树组成。

进一步地,所述并根据小时GBDT预测模型预测待预测日的24小时负荷向量的具体过程为:

初始化预测时刻i=0;

构建i时带预测负荷的特征向量yi

递归预测i时的负荷hourloadi,构成特征向量yi,其中i的取值为0~23的整数。

进一步地,所述待预测日的最终负荷向量

final_pred=[pred0,pred1,...,pred23],

式中

发明内容中提供的效果仅仅是实施例的效果,而不是发明所有的全部效果,上述技术方案中的一个技术方案具有如下优点或有益效果:

1、通过建立梯度提升决策树模型,充分挖掘历史负荷数据中的特征并构造不同的梯度提升决策树模型来提高短期负荷预测的精度,且泛化误差可控、收敛速度快、调节参数少。

2、通过构件全天梯度提升决策树模型和小时梯度提升决策树模型,得到基于“全天”的负荷特征向量和基于“小时”的负荷特征向量,来预测最终的待预测日负荷向量,进一步提高短期负荷预测的精度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明所述方法的流程示意图;

图2是本发明训练第m棵最小二乘回归树模型的流程示意图;

图3是本发明构造待预测日的全天负荷向量的流程示意图;

图4是本发明构造待预测日的24小时负荷向量的流程示意图。

具体实施方式

为能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。

在缺少诸如天气温度等有效信息只有历史负荷数据的情况下,本发明实施例通过充分挖掘历史负荷数据的特征,并根据不同的日期类型(工作日、休息日)选取不同的训练数据来构造全天梯度提升决策树(GBDT)模型与小时梯度提升决策树两种模型,综合两种模型的预测结果作为最终预测结果输出,以此来得到更为精确的短期负荷预测结果。

如附图1所示,具体的实施过程包括如下步骤:

步骤1,根据待预测日前N(N>90)天历史负荷数据构建原始数据集A0,具体为:获取待预测日之前N(N>90)天的数据作为原始数据集A0,其中每天的数据视为一个原始数据样本,每个原始数据样本由每天的24h负荷数据24个数据点和年、月、日时间信息3个数据点共27个数据点构成。

步骤2,从原始数据集A0中筛选出构建训练样本的数据集B,具体步骤如下:

1)在A0中筛选出与待预测日日期类型(分为工作日和休息日)相同的数据集,记为A1

2)过滤A1的异常数据,得到正常数据集A2,具体步骤如下:

(a)统计A1中每个数据样本中正常负荷点的个数K,正常负荷点的判定方式如下所示:

Q11<loadi<Q3i(i=0,1,2,...,23)>

(1)式中,Q1i为所有样本i时负荷数据的1/4分位点,Q3i为所有样本i时负荷数据的3/4分位点,loadi为当前待判定数据样本在i时刻的负荷数据;

(b)将正常负荷点个数K>18的样本加入正常数据集A2

3)在A2中筛选出最有可能与待预测日相似的M(M<N-3)天的数据集B,具体的筛选步骤如下:

(a)计算待预测日前一天负荷数据向量与A2中所有样本负荷数据向量的欧式距离作为相似度的度量并排序,相似度的计算公式如下所示:

(2)式中,rd表示A2中第d个样本与待预测日前一天负荷数据向量的相似度,preloadi为待预测日前一天i时的负荷数据,P为数据集A2的样本个数,hispreloadd,i为A2中第d个样本的i时负荷数据;

(b)取出步骤2的3)的(a)中与待预测日前一天负荷向量相似度最大的M天数据加入数据集B,M的取值公式如下所示:

M=min(30,[P*0.7]) (3)

(3)式中,P为数据集A2的样本个数,[]表示向下取整,min()表示取括号中二者值之间较小的一个;

步骤3,由步骤2得到的数据集B构造GBDT模型所需要的训练样本集(X,Y),即

(X,Y)={(xj,i,yj,i)|i=0,1,2,...,23;j=1,2,...,M}>

(4)式中,xj,i表示由数据集B中第j个样本i时的负荷数据点构造出的训练输入特征向量Xj,i,xj,i包含元素的具体构成与含义如表1所示。yj,i表示数据集B中第j个样本i时的负荷值,构造为对应训练样本的响应值。

表1

步骤4,由全部样本集(X,Y)训练构造全天GBDT预测模型,记为y=f_day(x),该模型由L=1000棵深度为3的最小二乘回归树组成,学习率设为λ=0.04,训练的具体步骤如下:

1)记训练第m课树得到的模型为Tm(x)(m=1,2,...,L);记由前m课树得到的综合预测模型为fm(x),在训练第一个树之前,初始化:

则可以得到:

2)如图2所示,训练第m棵最小二乘二叉回归树的模型Tm(x),训练的具体步骤如下:

(a)计算前m-1棵树综合预测模型的针对所有训练样本xj,i得到的预测值fm-1(xj,i);

(b)计算前m-1棵树得到的预测值与真实值的残差residualm,j,i,计算公式如下:

residualm,j,i=yj,i-fm-1(xj,i)>

所有的残差residualm,j,i构成新的训练样本响应集,即

Rm={residualm,j,i|i=0,1,2,...,23;j=1,2,...,M}>

(c)将训练样本特征集X与步骤4的2)的(b)训练样本响应集Rm共同构成新的训练数据集(X,Rm),即

(X,Rm)={(xj,i,residualm,j,i)|i=0,1,2,...,23;j=1,2,...,M}>

由(X,Rm)来训练一棵深度为3的最小二乘二叉回归树T′m(x);

(d)将步骤4的2)的(c)的中得到的第m棵树模型T′m(x)得到的结果乘上GBDT模型设置的学习率λ得到最终的第m棵树的模型Tm(x),即:

Tm(x)=λ*T′m(x)>

3)按照步骤4的2)中(a)-(d)的顺序训练完第1到L课树,即得到全天GBDT预测模型模型f_day(x):

步骤5,将全部样本集(X,Y)按24小时分割为24个样本子集,并分别训练构造24个小时GBDT预测模型,记i时训练的GBDT模型为yi=f_houri(x)(i=0,1,...,23),具体步骤如下:

1)构建24小时的独立GBDT预测模型的训练集,在样本集(X,Y)中取出所有由i时的负荷点得到的样本(xj,i,yj,i),即可构成i时的训练样本子集(Xi,Yi),即

(Xi,Yi)={(xj,i,yj,i)|j=1,2,...,M}>

2)由步骤5的1)得到的24个样本子集(Xi,Yi)训练分别训练24个小时GBDT预测模型yi=f_houri(x)(i=0,1,...,23),每个模型由L=500棵深度为3的最小二乘回归树组成,学习率设为λ=0.06,训练的具体步骤同步骤4的1)~3)相同,只是训练数据不同,对应的训练的数据为i时负荷数据构造的样本子集(Xi,Yi);

步骤6,使用步骤4得到的全天GBDT预测模型y=f_day(x)得到待预测日的24小时的负荷向量day_pred=[dayload0,dayload1,...,dayload23],如图3所示,具体步骤如下:

1)初始化预测时刻i=0;

2)按步骤3的训练样本特征向量的构建原则,构建i时待预测负荷的特征向量xi

3)预测i时的负荷dayloadi=f_day(xi);

4)预测时刻i=i+1,若i大于23则全天预测完成,否则回到上述步骤6的2)继续递归的进行预测,得到待预测日的全天负荷向量。

步骤7,使用步骤5得到的24个小时GBDT模型

yi=f_houri(x)(i=0,1,...,23)得到待预测日的24小时的负荷向量hour_pred=[hourload0,hourload1,...,hourload23],如附图4所示,具体步骤如下:

1)初始化预测时刻i=0;

2)按步骤3的训练样本特征向量的构建原则,构建i时待预测负荷的特征向量xi

3)预测i时的负荷hourloadi=f_houri(xi)(i=0,1,...,23);

4)预测时刻i=i+1,若i大于23则全天预测完成,否则回到步骤7的2)继续递归的进行预测,得到待预测日的24小时负荷向量。

步骤8,结合全天GBDT预测模型预测的全天负荷向量与24个小时GBDT预测模型预测的24小时负荷向量得到最终的待预测日的负荷向量

final_pred=[pred0,pred1,...,pred23],具体的计算公式如下:

上式中,hourloadi为小时GBDT预测模型得到的i时预测负荷,dayloadi为全天GBDT预测模型得到的i时预测负荷,predi为最终确定的i时预测负荷,min()表示取括号中二者值小的一个,max()表示取括号中二者值较大的一个。

以上所述只是本发明的优选实施方式,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也被视为本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号