首页> 中国专利> 一种基于用户用电负荷数据细分的聚类融合方法

一种基于用户用电负荷数据细分的聚类融合方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

一种基于用户用电负荷数据细分的聚类融合方法，包括以下步骤：1）采集数据；2）修正数据；3）转换数据；4）标准化数据；5）构造预处理聚类算法集；6）构建共识矩阵；7）运行聚类融合方法；8）归集用户。本发明将不同聚类算法或者同一聚类算法下使用不同参数得到的结果进行自动化合并，通过聚类融合可自动判别并生成最优的聚类结果，提高了聚类分析模型的自适应处理能力，降低用户用电负荷数据聚类分析过程中对先验知识的依赖度，减少人工操作，提高了方法的自动化程度。

著录项

公开/公告号CN103093394A

专利类型发明专利
公开/公告日2013-05-08

原文格式PDF
申请/专利权人广东电网公司信息中心;
展开▼

申请/专利号CN201310025526.0
发明设计人黄剑文;陈军;苏凯;严宇平;吴广财;莫玉纯;陈非;张世良;蔡嘉荣;
展开▼

申请日2013-01-23
分类号G06Q50/06(20120101);
代理机构44104 广州知友专利商标代理有限公司;
代理人周克佑
地址 510000 广东省广州市越秀区东风东路东峻广场4栋25楼
入库时间 2024-02-19 19:06:55

法律信息

法律状态公告日

法律状态信息

法律状态
2017-08-04

专利权人的姓名或者名称、地址的变更 IPC(主分类):G06F19/00 变更前: 变更后: 申请日:20130123

专利权人的姓名或者名称、地址的变更
2016-06-22

授权

授权
2013-12-18

实质审查的生效 IPC(主分类):G06Q50/06 申请日:20130123

实质审查的生效
2013-05-08

公开

公开

说明书

技术领域

本发明涉及电力系统负荷建模技术领域，特别涉及一种基于用户用电负荷数据细分的聚类融合算法。

背景技术

用户用电负荷数据分析是供电企业了解用户用电负荷模式特性的重要方法，对供电企业规划负荷管理、变电站建设、电网运行状态评估等方面具有重要的作用。通过研究用户的用电负荷模式特性，有助于供电企业更深刻地认识用户，并能够根据不同的用户群制订相应的市场策略、提供针对性的个性化服务。

基于用户用电负荷数据的用户群细分，目前主流的研究方式是依据用户日用电负荷曲线的形态变化，使用聚类分析算法对用户用电负荷数据进行智能分群，从中寻找用户用电行为的典型模式。

应用于用户用电行为研究的聚类分析方法一般包括划分的方法、层次的方法、基于密度的方法。国内的研究大多根据用户用电负荷数据的特性，选定以上某种聚类算法并加以改进，再通过人工比对聚类效果，选取结果较好的聚类模型。由于用户用电负荷数据是不平衡的时间序列数据，数据结构的时序特性严重地影响传统聚类算法的效果。为得到较为可靠的聚类效果，需要根据不同的分析数据和先验知识，对聚类模型进行频繁的人工修整和改造，导致聚类模型适用性、鲁棒性较差，分析结果依赖于人工操作，无法实现系统固化。

发明内容

本发明所要解决的技术问题，就是提供一种基于用户用电负荷数据细分的聚类融合方法，将不同聚类算法或者同一聚类算法下使用不同参数得到的结果进行自动化合并，得到比单一算法更加符合数据特性的分析结果，减少人工处理环节，提高聚类分析模型的自适应处理能力，满足频繁波动的用户用电负荷数据的分析需求。

本发明解决其技术问题所采用的技术方案如下：

一种基于用户用电负荷数据细分的聚类融合方法，包括以下步骤：

S1采集指定时刻t用户用电正向有功读数数据W_t和正向无功读数数据 Var_t；

采集某段时间内各指定时间点t的用户用电正向有功读数数据W_t和正向无功读数数据Var_t；

S2对采集的用户用电读数数据进行规范性校对：先删除采集的用户用电读数数据中的冗余数据，再查找用户用电读数数据中的缺失字段，选择作为分析对象的用户，对分析对象的用电读数数据进行修补缺失数据和剔除异常数据处理；

S3根据用户用电正向有功和正向无功读数数据W_t、Var_t，计算出各用户在指定时刻t的用电负荷数据S_t，并列写以用户为行、时刻t用电负荷数据S_t为列的矩阵S[n][t]，其中n为用户数，t为时刻，如0点、1点等；

根据处理后的数据，计算各用户在各指定时间点t的用电负荷数据S_t，并形成以用户为行，指定时间点的用电负荷数据S_t为列的矩阵S[N][t]，其中，N表示用户数，t表示各指定的时间点，如0点、1点等；

S4对用户用电负荷数据S_t进行标准化处理，以提取负荷形态；

S5选择一种以上的通用聚类算法构造预处理聚类算法集，根据先验知识设定两组以上运行参数，计算各通用聚类算法在各组运行参数下的用户用电负荷数据细分结果从而得到用户用电负荷数据细分结果集合，集合中对应同一组运行参数和同一通用聚类算法的结果为一个聚类成员，每一个聚类成员中根据各组运行参数的设定情况不同分为若干个簇，用户用电负荷细分结果最终归属于各簇，每个簇为一个以该簇为列、用户为行的单列“0”“1”矩阵，“1”表示某用户属于该簇，“0”表示某用户不属于该簇，簇是某一聚类成员对用户用电负荷数据细分结果的分类标识；

S6根据聚类成员构建共识矩阵，其元素为两两用户属于同一簇的概率；

S7随即选取m个用户作为典型用户，计算其对应的距离准则函数值，遍历所有典型用户组合，并选择对应最小距离准则函数值的典型用户组合，计算其它各个用户与这组典型用户中的各个用户属于同一簇的概率；

S8设定概率阀值，以对应最小距离准则函数值的典型用户组合为簇中心归集其他用户，得到最终的聚类结果。

作为本发明的优选实施例，上述步骤S2可通过如下步骤实现：

S2-1删除采集的用户用电正向有功、正向无功读数数据W_t、Var_t中重复采集或重复记录的冗余数据；

S2-2查找用户用电正向有功、正向无功读数数据W_t、Var_t中的缺失字段，选择数据缺失量小于20%的用户作为分析对象，查找分析对象用电读数数据中的缺失字段，用平滑修正函数的计算结果替代，查找分析对象用电读数数据中不符合用电特性的异常数据，用平滑修正函数的计算结果替代；

平滑修正函数的表达式为：

$W_{t} = \frac{Σ_{k = 1}^{m_{1}} W_{t - k} + Σ_{i = 1}^{m_{2}} W_{t + i}}{m_{1} + m_{2}}$

${Var}_{t} = \frac{Σ_{k = 1}^{m_{1}} {Var}_{t - k} + Σ_{i = 1}^{m_{2}} {Var}_{t + i}}{m_{1} + m_{2}}$

m₁为向前采集的点数，m₂为向后采集的点数。

作为本发明的优选实施例，上述步骤S4中推荐通过如下标准化公式对各用户的用电负荷数据S[N][t]进行标准化处理:

${S^{'}}_{ij} = \frac{S_{ij} - \frac{1}{24 \times T} Σ_{j = 1}^{24 \times T} S_{ij}}{\max (S_{ij}) - \min (S_{ij})}$

或

${S^{'}}_{ij} = \frac{S_{ij} - \min (S_{ij})}{\max (S_{ij}) - \min (S_{ij})}$

或

其中，T为天数，S_ij为第i个用户在j时刻的用电负荷数据。

作为本发明的推荐实施方式，所述预处理聚类算法集包括SKMEANS（多球面的k均值聚类分析算法）、CCFKMS（共轭凸函数聚类分析算法）、FCM（模糊 C均值聚类分析算法）三种通用聚类算法。

上述步骤S6中的共识矩阵可通过如下步骤构建：

S6-1将各聚类成员进行矩阵合并，得到矩阵H；

S6-2通过矩阵H构建共识矩阵A，依据公式：

$A = \frac{1}{r} H \cdot H^{T}$

其中，r为聚类成员总数。

上述步骤S7具体可通过下述步骤实现：

S7-1随机选取m个用户作为典型用户；

S7-2计算其他用户与典型用户中的每个用户属于同一簇的概率pr_ij，依据公式： ${pr}_{ij} = a_{ij} - σ_{1} Σ_{k = 1, k \neq j}^{m} a_{ik}$

其中，i不属于m，j属于m，a_ij为共识矩阵A中的元素，σ₁为惩罚因子；

S7-3再根据上述概率pr_ij计算其他用户与典型用户中的每个用户之间的相异距离D_ij，依据公式：

$D_{ij} = \frac{d ({pr}_{ij})}{{pr}_{ij}} + σ_{2} Σ_{k = 1, k \neq j}^{m} \frac{d ({pr}_{ik})}{{pr}_{ik}},$

$d (x) = 1 - \cos (\frac{π}{2} \times x)$

其中，i不属于m，j属于m，d()为距离公式，σ₂为惩罚因子；

S7-4根据相异距离D_ij依据公式

L_H＝∑w_bD_ij，其中w_b为权重，默认值为

计算距离准则函数值L_H，再选取m个用户作为典型用户，返回步骤S7-1，直至遍历所有典型用户组合，得到距离准则函数值集

S7-5选取距离准则函数值的最小值找到该最小值对应的典型用户组合，计算其它各个用户与这组典型用户中的每个用户属于同一簇的概率。

相对现有技术本发明具有如下有益效果：

①本发明将不同聚类算法或者同一聚类算法下使用不同参数得到的结果进行自动化合并，通过聚类融合可自动判别并生成最优的聚类结果，提高了聚类分析模型的自适应处理能力，降低用户用电负荷数据聚类分析过程中对先验知识的依赖度，减少人工操作，提高了方法的自动化程度；

②本发明降低输入数据时序特性、噪声数据、异常数据等因素对用户用电负荷数据聚类分析过程的影响，提高了方法的鲁棒性；

附图说明

图1是本发明的聚类融合方法的流程框图；

图2是本发明步骤S3中列写的矩阵S[n][t]的示例图；

图3是本发明的聚类成员的示例图；

图4聚类成员进行矩阵合并得到矩阵H的过程图。

具体实施方式

下面结合附图1~4对本发明的一种基于用户用电负荷数据细分的聚类融合方法的原理和过程作进一步详细描述：

S1采集数据

采集计量自动化系统中各用户在指定时间段内如一天的24小时内各整点时刻t时的用户用电正向有功读数数据W_t和正向无功读数数据Var_t。

S2修正数据

对采集的用户用电数据进行规范性校对：

S2-1删除上述用户用电正向有功、正向无功读数数据W_t、Var_t中重复采集或重复记录的冗余数据；

S2-2查找用户用电正向有功、正向无功读数数据W_t、Var_t中的缺失字段，选择可以作为分析对象的用户，查找分析对象用电读数数据中的缺失字段，用平滑修正函数的计算结果替代，查找分析对象用电读数数据中不符合用电特性的异常数据，用平滑修正函数的计算结果替代；平滑修正函数的表达式为：

$W_{t} = \frac{Σ_{k = 1}^{m_{1}} W_{t - k} + Σ_{i = 1}^{m_{2}} W_{t + i}}{m_{1} + m_{2}}$

${Var}_{t} = \frac{Σ_{k = 1}^{m_{1}} {Var}_{t - k} + Σ_{i = 1}^{m_{2}} {Var}_{t + i}}{m_{1} + m_{2}}$

m₁为向前采集的点数，m₂为向后采集的点数，默认值为2；

选择作为分析对象的用户的标准为，若某用于的用电读数数据的缺失量达到该用户用电读数数据总量的20%以上，则不将该用户作为分析对象；异常数据主要包括读数骤降、激增或为负的数据等。

S3转换数据

根据处理后的数据，计算各用户在步骤S1中各整点时刻t的用电负荷数据S_t，依据如下公式计算用户在各整点时刻t的用电负荷数据S_t：

$S_{t} = \sqrt{{(W_{t + 1} - W_{t})}^{2} + {({Var}_{t + 1} - {Var}_{t})}^{2}}$

并列写以用户X₁~X_N为行、上述整点时刻0:00~23:00的用电负荷数据S_t为列的矩阵S[N][t]，如图2所示，其中N为用户数、t表示各指定的时间点，本实施例中，即为步骤S1中的各整点时刻。

S4标准化数据

为消除用电负荷的数量级对聚类分析和模式识别的影响，分别对用户用电负荷数据S_t进行标准化，以提取负荷形态，依据以下三个标准化公式均可实现对用户用电负荷数据S_t的标准化处理：

${S^{'}}_{ij} = \frac{S_{ij} - \frac{1}{24 \times T} Σ_{j = 1}^{24 \times T} S_{ij}}{\max (S_{ij}) - \min (S_{ij})}$

或

${S^{'}}_{ij} = \frac{S_{ij} - \min (S_{ij})}{\max (S_{ij}) - \min (S_{ij})}$

或

${S^{'}}_{ij} = \frac{S_{ij}}{\max (S_{ij})}$

其中，T为天数，S_ij为第i个用户在j时刻的用电负荷数据。

S5构造预处理聚类算法集

S5-1选择通用聚类算法中的SKMEANS（多球面的k均值聚类分析算法）、 CCFKMS（共轭凸函数聚类分析算法）、FCM（模糊C均值聚类分析算法）构造预处理聚类算法集，根据先验知识设定三组运行参数；

S5-2计算各通用聚类算法在各组运行参数下的用户用电负荷数据细分结果，得到初步的九组用户用电负荷细分结果，即九个聚类成员记为 H¹,H²,H³，...,H⁹。每一个聚类成员中根据各组运行参数的设定情况不同可分为若干个簇，如第一组运行参数设定的聚类数目为k，如图3所示，聚类成员H¹拥有簇 h₁~h_k，簇为一个以该簇为列、用户为行的单列“0”“1”矩阵，其中数字“1” 表示用电用户x_i（此处i属于N）属于簇h_j，反之，数字“0”表示该用户不属于该簇。

S6构建共识矩阵

S6-1将各聚类成员H¹,H²,...,H⁹进行矩阵合并，如图4所示，得到矩阵H；

S6-2通过矩阵H构建共识矩阵A，依据公式：

$A = \frac{1}{r} H \cdot H^{T}$

其中，r为聚类成员总数，共识矩阵A中第i行第j列元素a_ij表示用户i与用户j属于同一簇的概率。

S7运行聚类融合方法

S7-1随机选取m个用户作为典型用户，根据先验知识，m的默认值为4；

S7-2计算用户i（i不属于m）与典型用户中的每个用户属于同一簇的概率pr_ij，依据公式：

${pr}_{ij} = a_{ij} - σ_{1} Σ_{k = 1, k \neq j}^{m} a_{ik}$

其中，i不属于m，j属于m，a_ij为共识矩阵A中的元素，σ₁为惩罚因子，默认值为所有pr_ij值构成概率关系矩阵Pr，pr_ij第i个用户与第j个典型用户属于同一簇的概率；

S7-3再根据上述概率关系矩阵Pr计算其他用户与典型用户中的每个用户之间的相异距离D_ij，依据公式：

$D_{ij} = \frac{d ({pr}_{ij})}{{pr}_{ij}} + σ_{2} Σ_{k = 1, k \neq j}^{m} \frac{d ({pr}_{ik})}{{pr}_{ik}},$

$d (x) = 1 - \cos (\frac{π}{2} \times x)$

其中，i不属于m，j属于m，pr_ij为概率关系矩阵Pr中的元素，d()为距离公式， σ₂为惩罚因子，默认值为

S7-4根据相异距离D_ij依据公式：

L_H＝∑w_bD_ij，其中w_b为权重，默认值为

计算距离准则函数L_H，距离准则函数L_H表示其他用户与典型用户各成员之间的距离和，再选取m个用户作为典型用户，返回步骤S7-1，直至遍历所有典型用户组合，得到距离准则函数值集

S7-5选取距离准则函数的最小值输出对应的概率关系矩阵Pr’。

S8归集用户

设定概率阈值，默认值为0.5，将pr'_ij（pr'_ij为步骤S7-5中概率关系矩阵Pr’ 中的元素）大于阈值的用户i（i不属于m）归集到以典型用户j(j属于m）为中心的簇，得到最终的聚类结果。

使用本发明的聚类融合方法得到的分析结果可用于供电企业有序用电、错峰避峰、节能减排等业务领域，可辅助供电企业规划、制定有针对性的工作方案。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种基于用户用电负荷数据细分的聚类融合方法 [P] . 中国专利： CN103093394B . 2016.06.22
2. 一种基于用户用电负荷数据细分的聚类融合方法 [P] . 中国专利： CN103093394A . 2013-05-08
3. A METHOD AND SYSTEM FOR MANAGING AN ELECTRICAL LOAD OF A USER FACILITY BASED ON LOCALLY MEASURED CONDITIONS OF AN ELECTRICITY SUPPLY GRID [P] . 欧洲知识产权局专利： EP2556343A1 . 2013-02-13

机译：基于供电网局部测量条件的用户设施用电负荷管理方法和系统
4. METHOD AND SYSTEM FOR MANAGING AN ELECTRICAL LOAD OF A USER FACILITY BASED ON LOCALLY MEASURED CONDITIONS OF AN ELECTRICITY SUPPLY GRID [P] . 美国专利： US2013162215A1 . 2013-06-27

机译：基于供电网局部测量条件的用户设施用电负荷管理方法和系统
5. A METHOD AND SYSTEM FOR MANAGING AN ELECTRICAL LOAD OF A USER FACILITY BASED ON LOCALLY MEASURED CONDITIONS OF AN ELECTRICITY SUPPLY GRID [P] . 世界知识产权组织专利： WO2011124657A1 . 2011-10-13

机译：基于供电网局部测量条件的用户设施用电负荷管理方法和系统