首页> 中国专利> 一种基于用户用电负荷数据细分的聚类融合方法

一种基于用户用电负荷数据细分的聚类融合方法

摘要

一种基于用户用电负荷数据细分的聚类融合方法,包括以下步骤:1)采集数据;2)修正数据;3)转换数据;4)标准化数据;5)构造预处理聚类算法集;6)构建共识矩阵;7)运行聚类融合方法;8)归集用户。本发明将不同聚类算法或者同一聚类算法下使用不同参数得到的结果进行自动化合并,通过聚类融合可自动判别并生成最优的聚类结果,提高了聚类分析模型的自适应处理能力,降低用户用电负荷数据聚类分析过程中对先验知识的依赖度,减少人工操作,提高了方法的自动化程度。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-08-04

    专利权人的姓名或者名称、地址的变更 IPC(主分类):G06F19/00 变更前: 变更后: 申请日:20130123

    专利权人的姓名或者名称、地址的变更

  • 2016-06-22

    授权

    授权

  • 2013-12-18

    实质审查的生效 IPC(主分类):G06Q50/06 申请日:20130123

    实质审查的生效

  • 2013-05-08

    公开

    公开

说明书

技术领域

本发明涉及电力系统负荷建模技术领域,特别涉及一种基于用户用电负荷数 据细分的聚类融合算法。

背景技术

用户用电负荷数据分析是供电企业了解用户用电负荷模式特性的重要方法, 对供电企业规划负荷管理、变电站建设、电网运行状态评估等方面具有重要的作 用。通过研究用户的用电负荷模式特性,有助于供电企业更深刻地认识用户,并 能够根据不同的用户群制订相应的市场策略、提供针对性的个性化服务。

基于用户用电负荷数据的用户群细分,目前主流的研究方式是依据用户日用 电负荷曲线的形态变化,使用聚类分析算法对用户用电负荷数据进行智能分群, 从中寻找用户用电行为的典型模式。

应用于用户用电行为研究的聚类分析方法一般包括划分的方法、层次的方法、 基于密度的方法。国内的研究大多根据用户用电负荷数据的特性,选定以上某种 聚类算法并加以改进,再通过人工比对聚类效果,选取结果较好的聚类模型。由 于用户用电负荷数据是不平衡的时间序列数据,数据结构的时序特性严重地影响 传统聚类算法的效果。为得到较为可靠的聚类效果,需要根据不同的分析数据和 先验知识,对聚类模型进行频繁的人工修整和改造,导致聚类模型适用性、鲁棒 性较差,分析结果依赖于人工操作,无法实现系统固化。

发明内容

本发明所要解决的技术问题,就是提供一种基于用户用电负荷数据细分的聚 类融合方法,将不同聚类算法或者同一聚类算法下使用不同参数得到的结果进行 自动化合并,得到比单一算法更加符合数据特性的分析结果,减少人工处理环节, 提高聚类分析模型的自适应处理能力,满足频繁波动的用户用电负荷数据的分析 需求。

本发明解决其技术问题所采用的技术方案如下:

一种基于用户用电负荷数据细分的聚类融合方法,包括以下步骤:

S1采集指定时刻t用户用电正向有功读数数据Wt和正向无功读数数据 Vart

采集某段时间内各指定时间点t的用户用电正向有功读数数据Wt和正向无 功读数数据Vart

S2对采集的用户用电读数数据进行规范性校对:先删除采集的用户用电读 数数据中的冗余数据,再查找用户用电读数数据中的缺失字段,选择作为分析对 象的用户,对分析对象的用电读数数据进行修补缺失数据和剔除异常数据处理;

S3根据用户用电正向有功和正向无功读数数据Wt、Vart,计算出各用户在 指定时刻t的用电负荷数据St,并列写以用户为行、时刻t用电负荷数据St为列 的矩阵S[n][t],其中n为用户数,t为时刻,如0点、1点等;

根据处理后的数据,计算各用户在各指定时间点t的用电负荷数据St,并形 成以用户为行,指定时间点的用电负荷数据St为列的矩阵S[N][t],其中,N表示 用户数,t表示各指定的时间点,如0点、1点等;

S4对用户用电负荷数据St进行标准化处理,以提取负荷形态;

S5选择一种以上的通用聚类算法构造预处理聚类算法集,根据先验知识设 定两组以上运行参数,计算各通用聚类算法在各组运行参数下的用户用电负荷数 据细分结果从而得到用户用电负荷数据细分结果集合,集合中对应同一组运行参 数和同一通用聚类算法的结果为一个聚类成员,每一个聚类成员中根据各组运行 参数的设定情况不同分为若干个簇,用户用电负荷细分结果最终归属于各簇,每 个簇为一个以该簇为列、用户为行的单列“0”“1”矩阵,“1”表示某用户属于该 簇,“0”表示某用户不属于该簇,簇是某一聚类成员对用户用电负荷数据细分结 果的分类标识;

S6根据聚类成员构建共识矩阵,其元素为两两用户属于同一簇的概率;

S7随即选取m个用户作为典型用户,计算其对应的距离准则函数值,遍历 所有典型用户组合,并选择对应最小距离准则函数值的典型用户组合,计算其它 各个用户与这组典型用户中的各个用户属于同一簇的概率;

S8设定概率阀值,以对应最小距离准则函数值的典型用户组合为簇中心归 集其他用户,得到最终的聚类结果。

作为本发明的优选实施例,上述步骤S2可通过如下步骤实现:

S2-1删除采集的用户用电正向有功、正向无功读数数据Wt、Vart中重复采 集或重复记录的冗余数据;

S2-2查找用户用电正向有功、正向无功读数数据Wt、Vart中的缺失字段, 选择数据缺失量小于20%的用户作为分析对象,查找分析对象用电读数数据中的 缺失字段,用平滑修正函数的计算结果替代,查找分析对象用电读数数据中不符 合用电特性的异常数据,用平滑修正函数的计算结果替代;

平滑修正函数的表达式为:

Wt=Σk=1m1Wt-k+Σi=1m2Wt+im1+m2

Vart=Σk=1m1Vart-k+Σi=1m2Vart+im1+m2

m1为向前采集的点数,m2为向后采集的点数。

作为本发明的优选实施例,上述步骤S4中推荐通过如下标准化公式对各用 户的用电负荷数据S[N][t]进行标准化处理:

Sij=Sij-124×TΣj=124×TSijmax(Sij)-min(Sij)

Sij=Sij-min(Sij)max(Sij)-min(Sij)

其中,T为天数,Sij为第i个用户在j时刻的用电负荷数据。

作为本发明的推荐实施方式,所述预处理聚类算法集包括SKMEANS(多球 面的k均值聚类分析算法)、CCFKMS(共轭凸函数聚类分析算法)、FCM(模糊 C均值聚类分析算法)三种通用聚类算法。

上述步骤S6中的共识矩阵可通过如下步骤构建:

S6-1将各聚类成员进行矩阵合并,得到矩阵H;

S6-2通过矩阵H构建共识矩阵A,依据公式:

A=1rH·HT

其中,r为聚类成员总数。

上述步骤S7具体可通过下述步骤实现:

S7-1随机选取m个用户作为典型用户;

S7-2计算其他用户与典型用户中的每个用户属于同一簇的概率prij,依据 公式:prij=aij-σ1Σk=1,kjmaik

其中,i不属于m,j属于m,aij为共识矩阵A中的元素,σ1为惩罚因子;

S7-3再根据上述概率prij计算其他用户与典型用户中的每个用户之间的相 异距离Dij,依据公式:

Dij=d(prij)prij+σ2Σk=1,kjmd(prik)prik,

d(x)=1-cos(π2×x)

其中,i不属于m,j属于m,d()为距离公式,σ2为惩罚因子;

S7-4根据相异距离Dij依据公式

LH=∑wbDij,其中wb为权重,默认值为

计算距离准则函数值LH,再选取m个用户作为典型用户,返回步骤S7-1,直 至遍历所有典型用户组合,得到距离准则函数值集

S7-5选取距离准则函数值的最小值找到该最小值对应 的典型用户组合,计算其它各个用户与这组典型用户中的每个用户属于同一簇的 概率。

相对现有技术本发明具有如下有益效果:

①本发明将不同聚类算法或者同一聚类算法下使用不同参数得到的结果进 行自动化合并,通过聚类融合可自动判别并生成最优的聚类结果,提高了聚类分 析模型的自适应处理能力,降低用户用电负荷数据聚类分析过程中对先验知识的 依赖度,减少人工操作,提高了方法的自动化程度;

②本发明降低输入数据时序特性、噪声数据、异常数据等因素对用户用电负 荷数据聚类分析过程的影响,提高了方法的鲁棒性;

附图说明

图1是本发明的聚类融合方法的流程框图;

图2是本发明步骤S3中列写的矩阵S[n][t]的示例图;

图3是本发明的聚类成员的示例图;

图4聚类成员进行矩阵合并得到矩阵H的过程图。

具体实施方式

下面结合附图1~4对本发明的一种基于用户用电负荷数据细分的聚类融合方 法的原理和过程作进一步详细描述:

S1采集数据

采集计量自动化系统中各用户在指定时间段内如一天的24小时内各整点时 刻t时的用户用电正向有功读数数据Wt和正向无功读数数据Vart

S2修正数据

对采集的用户用电数据进行规范性校对:

S2-1删除上述用户用电正向有功、正向无功读数数据Wt、Vart中重复采集 或重复记录的冗余数据;

S2-2查找用户用电正向有功、正向无功读数数据Wt、Vart中的缺失字段, 选择可以作为分析对象的用户,查找分析对象用电读数数据中的缺失字段,用平 滑修正函数的计算结果替代,查找分析对象用电读数数据中不符合用电特性的异 常数据,用平滑修正函数的计算结果替代;平滑修正函数的表达式为:

Wt=Σk=1m1Wt-k+Σi=1m2Wt+im1+m2

Vart=Σk=1m1Vart-k+Σi=1m2Vart+im1+m2

m1为向前采集的点数,m2为向后采集的点数,默认值为2;

选择作为分析对象的用户的标准为,若某用于的用电读数数据的缺失量达到 该用户用电读数数据总量的20%以上,则不将该用户作为分析对象;异常数据主 要包括读数骤降、激增或为负的数据等。

S3转换数据

根据处理后的数据,计算各用户在步骤S1中各整点时刻t的用电负荷数据St, 依据如下公式计算用户在各整点时刻t的用电负荷数据St

St=(Wt+1-Wt)2+(Vart+1-Vart)2

并列写以用户X1~XN为行、上述整点时刻0:00~23:00的用电负荷数据St为列 的矩阵S[N][t],如图2所示,其中N为用户数、t表示各指定的时间点,本实施例 中,即为步骤S1中的各整点时刻。

S4标准化数据

为消除用电负荷的数量级对聚类分析和模式识别的影响,分别对用户用电负 荷数据St进行标准化,以提取负荷形态,依据以下三个标准化公式均可实现对用 户用电负荷数据St的标准化处理:

Sij=Sij-124×TΣj=124×TSijmax(Sij)-min(Sij)

Sij=Sij-min(Sij)max(Sij)-min(Sij)

Sij=Sijmax(Sij)

其中,T为天数,Sij为第i个用户在j时刻的用电负荷数据。

S5构造预处理聚类算法集

S5-1选择通用聚类算法中的SKMEANS(多球面的k均值聚类分析算法)、 CCFKMS(共轭凸函数聚类分析算法)、FCM(模糊C均值聚类分析算法)构造预 处理聚类算法集,根据先验知识设定三组运行参数;

S5-2计算各通用聚类算法在各组运行参数下的用户用电负荷数据细分结 果,得到初步的九组用户用电负荷细分结果,即九个聚类成员记为 H1,H2,H3,...,H9。每一个聚类成员中根据各组运行参数的设定情况不同可分为若 干个簇,如第一组运行参数设定的聚类数目为k,如图3所示,聚类成员H1拥有簇 h1~hk,簇为一个以该簇为列、用户为行的单列“0”“1”矩阵,其中数字“1” 表示用电用户xi(此处i属于N)属于簇hj,反之,数字“0”表示该用户不属于 该簇。

S6构建共识矩阵

S6-1将各聚类成员H1,H2,...,H9进行矩阵合并,如图4所示,得到矩阵H;

S6-2通过矩阵H构建共识矩阵A,依据公式:

A=1rH·HT

其中,r为聚类成员总数,共识矩阵A中第i行第j列元素aij表示用户i与 用户j属于同一簇的概率。

S7运行聚类融合方法

S7-1随机选取m个用户作为典型用户,根据先验知识,m的默认值为4;

S7-2计算用户i(i不属于m)与典型用户中的每个用户属于同一簇的概率prij, 依据公式:

prij=aij-σ1Σk=1,kjmaik

其中,i不属于m,j属于m,aij为共识矩阵A中的元素,σ1为惩罚因子,默 认值为所有prij值构成概率关系矩阵Pr,prij第i个用户与第j个典型用户属于 同一簇的概率;

S7-3再根据上述概率关系矩阵Pr计算其他用户与典型用户中的每个用户之 间的相异距离Dij,依据公式:

Dij=d(prij)prij+σ2Σk=1,kjmd(prik)prik,

d(x)=1-cos(π2×x)

其中,i不属于m,j属于m,prij为概率关系矩阵Pr中的元素,d()为距离公式, σ2为惩罚因子,默认值为

S7-4根据相异距离Dij依据公式:

LH=∑wbDij,其中wb为权重,默认值为

计算距离准则函数LH,距离准则函数LH表示其他用户与典型用户各成员之 间的距离和,再选取m个用户作为典型用户,返回步骤S7-1,直至遍历所有典型 用户组合,得到距离准则函数值集

S7-5选取距离准则函数的最小值输出对应的概率关系 矩阵Pr’。

S8归集用户

设定概率阈值,默认值为0.5,将pr'ij(pr'ij为步骤S7-5中概率关系矩阵Pr’ 中的元素)大于阈值的用户i(i不属于m)归集到以典型用户j(j属于m)为中心 的簇,得到最终的聚类结果。

使用本发明的聚类融合方法得到的分析结果可用于供电企业有序用电、错峰 避峰、节能减排等业务领域,可辅助供电企业规划、制定有针对性的工作方案。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号