首页> 中国专利> 用于电力系统负荷预测模型的样本数据提取方法和装置

用于电力系统负荷预测模型的样本数据提取方法和装置

摘要

本发明适用于人工智能技术领域,提供了用于电力系统负荷预测模型的样本数据提取方法和装置,该方法包括:获取电力系统历史负荷的时序数据;根据所述时序数据的时间戳,构造所述时序数据在时间分类下的第一特征矩阵;利用时间窗口平移得到平移至N天前的时序数据,并构造N天前的时序数据在全天小时分类下的第二特征矩阵;对时间窗口平移得到平移至N天前的时序数据进行tsfresh特征提取,得到i个第三特征矩阵;拼合所述第一特征矩阵、第二特征矩阵及第三特征矩阵,生成目标样本数据;输出所述目标样本数据。利用该样本数据训练得到的预测模型,可以进一步提高模型的准确率。

著录项

  • 公开/公告号CN112308299A

    专利类型发明专利

  • 公开/公告日2021-02-02

    原文格式PDF

  • 申请/专利权人 新奥数能科技有限公司;

    申请/专利号CN202011117886.X

  • 发明设计人 赵涛;

    申请日2020-10-19

  • 分类号G06Q10/04(20120101);G06Q50/06(20120101);G06K9/62(20060101);G06N20/00(20190101);

  • 代理机构11687 北京嘉科知识产权代理事务所(特殊普通合伙);

  • 代理人杨波

  • 地址 100102 北京市朝阳区望京东路1号10层

  • 入库时间 2023-06-19 09:46:20

说明书

技术领域

本发明属于人工智能技术领域,尤其涉及用于电力系统负荷预测模型的样本数据提取方法和装置。

背景技术

由于电能有着不易储存的特点,电力行业的预测需求一直以来都比其他行业更加紧迫。因此,实现电力系统负荷的科学可靠预测是促进电网稳固运行的首要任务。具体的,电力系统负荷预测是一种时间序列预测,主要是通过大量的历史负荷数据建立起可以拟合历史数据变化规律的数学模型,该模型不仅可以定量表征出电力系统负荷数据的时间规律性,还可以作为负荷预测模型的雏形,实现对未来电力负荷的科学有效预测。

现有技术中,电力系统负荷预测模型的准确率是技术人员一直致力研究的技术问题。当前对于电力系统负荷的预测模型很多,相比于提出一种新的预测模型,对已有预测模型进行改进,进一步提升模型的准确率,同样是实际中的一个技术难题。

发明内容

鉴于现有技术中的问题,本发明实施例提供了用于电力系统负荷预测模型的样本数据提取方法和装置,以解决如何进一步提升电力系统负荷预测模型的准确率的问题。

本发明实施例的第一方面提供了一种用于电力系统负荷预测模型的样本数据提取方法,其包括:获取电力系统历史负荷的时序数据;根据所述时序数据的时间戳,构造所述时序数据在时间分类下的第一特征矩阵;利用时间窗口平移得到平移至N天前的时序数据,并构造N天前的时序数据在全天小时分类下的第二特征矩阵;对时间窗口平移得到平移至N天前的时序数据进行tsfresh特征提取,得到i个第三特征矩阵;拼合所述第一特征矩阵、第二特征矩阵及第三特征矩阵,生成目标样本数据;输出所述目标样本数据。

优选地,所述根据所述时序数据的时间戳,构造所述时序数据在时间分类下的第一特征矩阵,包括:获取时序数据的时间戳;根据所述时间戳,对所述时序数据按年、月、日、周和小时中的至少一种时间分类生成M列的第一特征矩阵,M为整数,且1≤M≤5。

优选地,所述利用时间窗口平移得到平移至N天前的时序数据,并构造N天前的时序数据在全天小时分类下的第二特征矩阵,包括:根据时间窗口平移,获取到对时间窗口平移到N天前的时序数据;对N天前的时序数据按小时分类,生成K列的第二特征矩阵,K为整数,且1≤K≤24。

优选地,所述对时间窗口平移得到平移至N天前的时序数据进行tsfresh特征提取,得到i个第三负荷特征矩阵,具体包括:调用tsfresh特征提取工具包,并设置(time_shift)时间参数;根据所述时间参数,至少提取对时间窗口平移到N天前的时序数据的i个特征的第三特征矩阵,其中,i>1。

优选地,所述拼合所述第一特征矩阵、第二特征矩阵及第三特征矩阵,生成目标样本数据,包括:根据第二特征矩阵,确定样本数量;根据第一特征矩阵和第三特征矩阵,确定每个样本中的特征数量;根据所述样本数量和特征数量,生成作为电力系统负荷预测模型训练样本的目标矩阵。

本发明实施例的第二方面提供了一种用于电力系统负荷预测模型的样本数据提取装置,具体包括:历史负荷获取模块,用于获取电力系统历史负荷的时序数据;第一特征构造模块,用于根据所述时序数据的时间戳,构造所述时序数据在时间分类下的第一特征矩阵;第二特征构造模块,用于利用时间窗口平移得到平移至N天前的时序数据,并构造N天前的时序数据在全天小时分类下的第二特征矩阵;第三特征构造模块,用于对时间窗口平移得到平移至N天前的时序数据进行tsfresh特征提取,得到i个第三特征矩阵;特征拼接模块,用于拼合所述第一特征矩阵、第二特征矩阵及第三特征矩阵,生成目标样本数据;目标样本输出模块,用于输出所述目标样本数据。

优选地,第一特征构造模块,可以具体包括:时间确定单元,用于获取时序数据的时间戳;第一特征矩阵构造单元,用于根据所述时间戳,对所述时序数据按年、月、日、周和小时中的至少一种时间分类生成M列的第一特征矩阵,M为整数,且1≤M≤5。

优选地,第二特征构造模块,可以具体包括:时间平移单元,用于根据时间窗口平移,获取到对时间窗口平移到N天前的时序数据;第二特征矩阵构造单元,用于对N天前的时序数据按小时分类,生成K列的第二特征矩阵,K为整数,且1≤K≤24。

优选地,第三特征构造模块,可以具体包括:配置单元,用于调用tsfresh特征提取工具包,并设置时间参数;第三特征矩阵构造单元,用于根据所述时间参数,至少提取对时间窗口平移到N天前的时序数据的i个特征的第三特征矩阵,其中,i>1。

优选地,特征拼接模块,可以具体包括:样本数量确定单元,用于根据第二特征矩阵,确定样本数量;特征数量确定单元,用于根据第一特征矩阵和第三特征矩阵,确定每个样本中的特征数量;目标矩阵生成单元,用于根据所述样本数量和特征数量,生成作为电力系统负荷预测模型训练样本的目标矩阵。

本发明实施例的有益效果是:本发明通过时间窗口平移来构造历史负荷特征,同时基于时间分类来构造时间特征,以及利用tsfresh特征提取工具来提取历史负荷特征,最后再对构造的三种特征进行拼接,生成用于电力系统预测模型的样本数据,利用该样本数据训练得到的预测模型,可以进一步提高模型的准确率。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。

图1为本发明在一实施例中提供的用于电力系统负荷预测模型的样本数据提取方法的流程图;

图2为上述图1中所述步骤S120在一实施例中的实现流程图;

图3为上述图1中所述步骤S130在一实施例中的实现流程图;

图4为上述图1中所述步骤S140在一实施例中的实现流程图;

图5为上述图1中所述步骤S150在一实施例中的实现流程图;

图6为本发明在一实施例中提供的用于电力系统负荷预测模型的样本数据提取装置的原理示意图。

具体实施方式

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。

在技术研发过程中,经发明人研究发现使用用户侧的负荷指标数据作为特征,通过该特征训练得到的预测模型的准确率并不理想。为此,发明人尝试对训练模型的样本数据进行实验,针对相同的负荷指标数据,即用户侧的历史负荷数据,采用不同的特征提取方式得到不同的特征数据,然后用这些不同的特征数据进行训练,发现所得到的预测模型的预测效果差异明显。

为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。

请参见图1,为本发明在一实施例中提供的用于电力系统负荷预测模型的样本数据提取方法的流程图。

结合图1所示,该样本数据提取方法,至少包括以下步骤S110-S160:

S110:获取电力系统历史负荷的时序数据。

其中,电力系统历史负荷是指用户侧(例如用电企业)的负荷指标数据,即根据用户侧的用电指标从数据库中筛选得到的数据。具体的,电力系统负荷数据具有时间性,所以也称为时序数据。在下文的一些描述中,电力系统负荷数据也可简称为历史负荷或负荷数据。

示例性的,假设获取的时序数据包括:用户侧提供小时级(即时间单位为小时)的负荷数据,假设有H个样本。

S120:根据所述时序数据的时间戳,构造所述时序数据在时间分类下的第一特征矩阵。

具体的,时间戳即负荷数据对应的时间,为此,可以按年、月、周、天及小时的时间分类来对时序数据进行划分,形成一个特征矩阵。

示例性的,见图2,为上述步骤S120在一实施例中的实现流程图,如图2所示,步骤S120可以具体包括步骤S210-S220:

S210:获取时序数据的时间戳;

S220:根据所述时间戳,对所述时序数据按年、月、日、周和小时中的至少一种时间分类生成M列的第一特征矩阵,M为整数,且1≤M≤5。

本示例提供的方法,利用时序数据的时间特征,对该时序数据体现为例如5列的特征矩阵,即第一特征矩阵。

S130:利用时间窗口平移得到平移至N天前的时序数据,并构造N天前的时序数据在全天小时分类下的第二特征矩阵。

根据实际应用场景对时间窗口进行平移后的负荷,例如,D日的实际负荷会在D+5日公布,所以在特征构造过程中使用5天前的负荷数据对实际负荷进行解释。

示例性的,见图3,为上述步骤S130在一实施例中的实现流程图。

结合图3所示,步骤S130,可以具体包括步骤S310-S320:

S310:根据时间窗口平移,获取到对时间窗口平移到N天前的时序数据;

S320:对N天前的时序数据按小时分类,生成K列的第二特征矩阵,K为整数,且1≤K≤24。

其中,N可以是任一的正整数。例如,当时间窗口平移N天后,对移至的前N天的1小时、2小时……24小时的历史负荷作为特征,即体现为特征矩阵的24列。具体一点说就是,第二负荷特征矩阵有24列,第一列为N天零1小时前的负荷,第二列为N天零2小时前的负荷,…,以此类推。

S140:对时间窗口平移得到平移至N天前的时序数据进行tsfresh特征提取,得到i个第三特征矩阵。

其中,所述tsfresh是开源的提取时序数据特征的python(一种计算机程序设计语言)包,能够提取出超过4000种特征。时间序列通常包含噪音、冗余或者不相关的信息,因此并非所有提取的特征对于机器学习任务来说都是有用的。为了避免提取不相关的特性,tsfresh包有一个内置的过滤过程,这个过滤过程评估了回归或者分类任务中每个特性的解释能力和重要性。

具体的,时间窗口平移得到平移至N天前的时序数据,是一个具体的时间序列数据,转换为矩阵来说,是一维数据。

见图4,为上述步骤S140在一实施例中的实现流程图。

结合图4所示,上述步骤S140,可以具体包括步骤S410-S420:

S410:调用tsfresh特征提取工具包,并设置时间参数;

S420:根据所述时间参数,至少提取对时间窗口平移到N天前的时序数据的i个特征的第三特征矩阵,其中,i>1。

所述时间参数,即tsfresh特征提取工具包中的time_shift参数,该time_shift参数即:最多可以提取当前时间点前多少个样本的特征。例如,将其设置为24,则最多可以提取前24个样本的特征。

S150:拼合所述第一特征矩阵、第二特征矩阵及第三特征矩阵,生成目标样本数据。

通过上述构造各类特征,通过进行拼接,可以使生成的样本数据更为丰富,相当于可以从不同维度体现历史负荷的特征。

示例性的,见图5,为上述步骤S150在一实施例中的实现流程图。

结合图5所示,上述步骤S150可以具体包括步骤S510-S530:

S510:根据第二特征矩阵,确定样本数量;

S520:根据第一特征矩阵和第三特征矩阵,确定每个样本中的特征数量;

S530:根据所述样本数量和特征数量,生成作为电力系统负荷预测模型训练样本的目标矩阵。

具体的,结合上述各示例,假设获取到的总的样本数量为H个;第一特征矩阵为包括年、月、周、日、时的5列矩阵;第二特征矩阵为时间窗口向前平移5天的全天24小时的24列矩阵;第三特征矩阵为tsfresh特征提取工具包提取到i个特征的i列矩阵。

为此,由于时间窗口平移5天,那么总的样本数量H将会减少24*5-24个样本,即最后将有(H-24*5-24)个样本;同时,在平移之后,根据时间特征构造的第一特征矩阵和tsfresh特征提取的第三特征矩阵,那么每个样本将有(5+24+i)个特征;那么,对三个构造的特征矩阵进行拼接,即得到的(n-144)×(29+i)阶的目标矩阵。

S160:输出所述目标样本数据。

关于利用构造目标特征矩阵训练预测模型后的结果评估与验证:下面将针对训练和预测分别构造特征矩阵,模型训练完成后,进行负荷预测,返回一个预测结果的时间序列。在上述模型训练和负荷晕预测的基础上,将预测结果与实际负荷进行比较,并使用r2-score作为评价标准。

其中,r

用y

具体的,利用下述公式1)确定回归平方和SSR:

其中,用

具体的,利用下述公式2)计算残差平方和SSE:

其中,y

具体的,利用下述公式3)计算总离差平方和SST:

其中,上述公式表示平均值与真实值的误差,反映与数学期望的偏离程度。根据上述评价方法,如果该结果越接近于1,则表明所构造特征对负荷的解释程度越高。

例如,在一实验中,采用上述第一特征矩阵、第二特征矩阵和第三特征矩阵作为特征进行分组训练同一预测算法得到模型的r

表1

由上表1可知,采用上述第一特征矩阵、第二特征矩阵和第三特征矩阵作为特征来训练的到的模型的r

综上所述,本发明提供的样本数据提取方法,通过时间窗口平移来构造历史负荷特征,同时基于时间分类来构造时间特征,以及利用tsfresh特征提取工具来提取历史负荷特征,最后再对构造的三种特征进行拼接,生成用于电力系统预测模型的样本数据。通过实验证明,利用该样本数据训练得到的预测模型相比于现有利用历史负荷数据训练的预测模型,准确率要明显高出很多。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

在与实施例一为相同发明构思的基础上,本实施例还提供了一种用于电力系统负荷预测模型的样本数据提取装置。

请参见图6,为本发明在一实施例中提供的用于电力系统负荷预测模型的样本数据提取装置的原理示意图。

结合图6所示,该用于电力系统负荷预测模型的样本数据提取装置600,具体包括:历史负荷获取模块610,用于获取电力系统历史负荷的时序数据;第一特征构造模块620,用于根据所述时序数据的时间戳,构造所述时序数据在时间分类下的第一特征矩阵;第二特征构造模块630,用于利用时间窗口平移得到平移至N天前的时序数据,并构造N天前的时序数据在全天小时分类下的第二特征矩阵;第三特征构造模块640,用于对时间窗口平移得到平移至N天前的时序数据进行tsfresh特征提取,得到i个第三特征矩阵;特征拼接模块650,用于拼合所述第一特征矩阵、第二特征矩阵及第三特征矩阵,生成目标样本数据;目标样本输出模块660,用于输出所述目标样本数据。

在一些示例性实施方式中,第一特征构造模块620,可以具体包括:时间确定单元,用于获取时序数据的时间戳;第一特征矩阵构造单元,用于根据所述时间戳,对所述时序数据按年、月、日、周和小时中的至少一种时间分类生成M列的第一特征矩阵,M为整数,且1≤M≤5。

在一些示例性实施方式中,第二特征构造模块630,可以具体包括:时间平移单元,用于根据时间窗口平移,获取到对时间窗口平移到N天前的时序数据;第二特征矩阵构造单元,用于对N天前的时序数据按小时分类,生成K列的第二特征矩阵,K为整数,且1≤K≤24。

在一些示例性实施方式中,第三特征构造模块640,可以具体包括:配置单元,用于调用tsfresh特征提取工具包,并设置时间参数;第三特征矩阵构造单元,用于根据所述时间参数,至少提取对时间窗口平移到N天前的时序数据的i个特征的第三特征矩阵,其中,i>1。

在一些示例性实施方式中,特征拼接模块650,可以具体包括:样本数量确定单元,用于根据第二特征矩阵,确定样本数量;特征数量确定单元,用于根据第一特征矩阵和第三特征矩阵,确定每个样本中的特征数量;目标矩阵生成单元,用于根据所述样本数量和特征数量,生成作为电力系统负荷预测模型训练样本的目标矩阵。

以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号